找回密碼
 To register

QQ登錄

只需一步,快速開始

掃一掃,訪問微社區(qū)

打印 上一主題 下一主題

Titlebook: Web Corpus Construction; Roland Sch?fer,Felix Bildhauer Book 2013 Springer Nature Switzerland AG 2013

[復(fù)制鏈接]
查看: 39552|回復(fù): 35
樓主
發(fā)表于 2025-3-21 17:57:39 | 只看該作者 |倒序瀏覽 |閱讀模式
書目名稱Web Corpus Construction
編輯Roland Sch?fer,Felix Bildhauer
視頻videohttp://file.papertrans.cn/1022/1021467/1021467.mp4
叢書名稱Synthesis Lectures on Human Language Technologies
圖書封面Titlebook: Web Corpus Construction;  Roland Sch?fer,Felix Bildhauer Book 2013 Springer Nature Switzerland AG 2013
描述The World Wide Web constitutes the largest existing source of texts written in a great variety of languages. A feasible and sound way of exploiting this data for linguistic research is to compile a static corpus for a given language. There are several adavantages of this approach: (i) Working with such corpora obviates the problems encountered when using Internet search engines in quantitative linguistic research (such as non-transparent ranking algorithms). (ii) Creating a corpus from web data is virtually free. (iii) The size of corpora compiled from the WWW may exceed by several orders of magnitudes the size of language resources offered elsewhere. (iv) The data is locally available to the user, and it can be linguistically post-processed and queried with the tools preferred by her/him. This book addresses the main practical tasks in the creation of web corpora up to giga-token size. Among these tasks are the sampling process (i.e., web crawling) and the usual cleanups including boilerplate removal and removal of duplicated content. Linguistic processing and problems with linguistic processing coming from the different kinds of noise in web corpora are also covered. Finally, the
出版日期Book 2013
版次1
doihttps://doi.org/10.1007/978-3-031-02152-7
isbn_softcover978-3-031-01024-8
isbn_ebook978-3-031-02152-7Series ISSN 1947-4040 Series E-ISSN 1947-4059
issn_series 1947-4040
copyrightSpringer Nature Switzerland AG 2013
The information of publication is updating

書目名稱Web Corpus Construction影響因子(影響力)




書目名稱Web Corpus Construction影響因子(影響力)學(xué)科排名




書目名稱Web Corpus Construction網(wǎng)絡(luò)公開度




書目名稱Web Corpus Construction網(wǎng)絡(luò)公開度學(xué)科排名




書目名稱Web Corpus Construction被引頻次




書目名稱Web Corpus Construction被引頻次學(xué)科排名




書目名稱Web Corpus Construction年度引用




書目名稱Web Corpus Construction年度引用學(xué)科排名




書目名稱Web Corpus Construction讀者反饋




書目名稱Web Corpus Construction讀者反饋學(xué)科排名




單選投票, 共有 0 人參與投票
 

0票 0%

Perfect with Aesthetics

 

0票 0%

Better Implies Difficulty

 

0票 0%

Good and Satisfactory

 

0票 0%

Adverse Performance

 

0票 0%

Disdainful Garbage

您所在的用戶組沒有投票權(quán)限
沙發(fā)
發(fā)表于 2025-3-21 23:59:57 | 只看該作者
板凳
發(fā)表于 2025-3-22 03:53:24 | 只看該作者
Web Corpus Construction978-3-031-02152-7Series ISSN 1947-4040 Series E-ISSN 1947-4059
地板
發(fā)表于 2025-3-22 06:01:49 | 只看該作者
5#
發(fā)表于 2025-3-22 09:30:33 | 只看該作者
6#
發(fā)表于 2025-3-22 13:50:33 | 只看該作者
7#
發(fā)表于 2025-3-22 17:19:22 | 只看該作者
8#
發(fā)表于 2025-3-22 21:48:15 | 只看該作者
9#
發(fā)表于 2025-3-23 05:24:04 | 只看該作者
10#
發(fā)表于 2025-3-23 06:22:17 | 只看該作者
Roland Sch?fer,Felix Bildhauerung gesetzt. So hie? es etwa mehrfach in der Presse: “Im Hochhaus gedeiht das Verbrechen”. Oder: “Die Kriminalit?t steigt mit der Anzahl der Stockwerke im Hochhaus”. Die mit dem Begriff “Jugendkriminalit?t” bezeichneten Probleme scheinen nicht nur in den Innenst?dten, sondern auch in überdurchschnit
 關(guān)于派博傳思  派博傳思旗下網(wǎng)站  友情鏈接
派博傳思介紹 公司地理位置 論文服務(wù)流程 影響因子官網(wǎng) 吾愛論文網(wǎng) 大講堂 北京大學(xué) Oxford Uni. Harvard Uni.
發(fā)展歷史沿革 期刊點評 投稿經(jīng)驗總結(jié) SCIENCEGARD IMPACTFACTOR 派博系數(shù) 清華大學(xué) Yale Uni. Stanford Uni.
QQ|Archiver|手機(jī)版|小黑屋| 派博傳思國際 ( 京公網(wǎng)安備110108008328) GMT+8, 2025-10-15 05:44
Copyright © 2001-2015 派博傳思   京公網(wǎng)安備110108008328 版權(quán)所有 All rights reserved
快速回復(fù) 返回頂部 返回列表
望江县| 文昌市| 桐庐县| 深泽县| 隆尧县| 孟州市| 浦城县| 大埔县| 米脂县| 灌阳县| 民和| 饶平县| 天全县| 河北区| 黄冈市| 拜城县| 大同市| 兴化市| 上饶市| 长垣县| 丰都县| 东方市| 渑池县| 聊城市| 揭东县| 井研县| 武胜县| 青川县| 隆回县| 诸城市| 永泰县| 岢岚县| 龙南县| 平度市| 绥芬河市| 墨竹工卡县| 当阳市| 万年县| 阜平县| 湟源县| 东方市|