Browse Wiki & Semantic Web

Jump to: navigation, search
Http://dbpedia.org/resource/TenTen Corpus Family
  This page has no properties.
hide properties that link here 
  No properties link to this page.
 
http://dbpedia.org/resource/TenTen_Corpus_Family
http://dbpedia.org/ontology/abstract The TenTen Corpus Family (also called TenTThe TenTen Corpus Family (also called TenTen corpora) is a set of comparable web text corpora, i.e. collections of texts that have been crawled from the World Wide Web and processed to match the same standards. These corpora are made available through the Sketch Engine corpus manager. There are TenTen corpora for more than 35 languages. Their target size is 10 billion (1010) words per language, which gave rise to the corpus family's name. In the creation of the TenTen corpora, data crawled from the World Wide Web are processed with natural language processing tools developed by the Natural Language Processing Centre at the Faculty of Informatics at Masaryk University (Brno, Czech Republic) and by the Lexical Computing company (developer of the Sketch Engine). company (developer of the Sketch Engine). , Родина корпусів ТенТен (англ. The TenTen CРодина корпусів ТенТен (англ. The TenTen Corpus Family) — це сукупність порівняльних веб-корпусів, укладених з лінгвістично вартісних текстів всесвітньої павутини. Доступ до корпусів реалізовано через корпусний менеджер Sketch Engine. Інструментарій цієї веб-платформи дає змогу детально досліджувати граматику, лексику та термінологію, аналізувати переклади, укладати частотні словники. До родини ТенТен входять корпуси 42 мов (за даними на квітень 2022). Цільовий розмір кожного з корпусів становить 10 мільярдів (1010) слововживань, це число й дало їм назву (1010 — «ten-ten»). Щоб отримати доступ до корпусів ТенТен, необхідно авторизуватися та купити підписку на сайті Sketch Engine. Можна скористатися 30-денним пробним періодом.а скористатися 30-денним пробним періодом.
http://dbpedia.org/ontology/wikiPageExternalLink https://www.sketchengine.co.uk/documentation/tenten-corpora/ +
http://dbpedia.org/ontology/wikiPageID 54292120
http://dbpedia.org/ontology/wikiPageLength 12210
http://dbpedia.org/ontology/wikiPageRevisionID 1018803597
http://dbpedia.org/ontology/wikiPageWikiLink http://dbpedia.org/resource/Macedonian_language + , http://dbpedia.org/resource/Isan_language + , http://dbpedia.org/resource/Finnish_language + , http://dbpedia.org/resource/Polish_language + , http://dbpedia.org/resource/Citation + , http://dbpedia.org/resource/Brown_Corpus + , http://dbpedia.org/resource/Peninsular_Spanish + , http://dbpedia.org/resource/Category:Czech_digital_libraries + , http://dbpedia.org/resource/Quotation + , http://dbpedia.org/resource/Spanish_language + , http://dbpedia.org/resource/Copying + , http://dbpedia.org/resource/Portuguese_language + , http://dbpedia.org/resource/Hebrew_language + , http://dbpedia.org/resource/Greek_language + , http://dbpedia.org/resource/Korean_language + , http://dbpedia.org/resource/Slovene_language + , http://dbpedia.org/resource/Russian_language + , http://dbpedia.org/resource/Swedish_language + , http://dbpedia.org/resource/Spanish_language_in_the_Americas + , http://dbpedia.org/resource/Sketch_Engine + , http://dbpedia.org/resource/Part-of-speech_tagging + , http://dbpedia.org/resource/Page_header + , http://dbpedia.org/resource/Text_corpora + , http://dbpedia.org/resource/Text_corpus + , http://dbpedia.org/resource/Khmer_language + , http://dbpedia.org/resource/Word-sense_disambiguation + , http://dbpedia.org/resource/Thai_language + , http://dbpedia.org/resource/German_language + , http://dbpedia.org/resource/Corpus_linguistics + , http://dbpedia.org/resource/French_language + , http://dbpedia.org/resource/N-grams + , http://dbpedia.org/resource/Lancaster-Oslo-Bergen_Corpus + , http://dbpedia.org/resource/Body_text + , http://dbpedia.org/resource/Category:Commercial_digital_libraries + , http://dbpedia.org/resource/Hungarian_language + , http://dbpedia.org/resource/Headline + , http://dbpedia.org/resource/Bulgarian_language + , http://dbpedia.org/resource/Tagalog_language + , http://dbpedia.org/resource/Lexical_analysis + , http://dbpedia.org/resource/British_National_Corpus + , http://dbpedia.org/resource/Czech_Republic + , http://dbpedia.org/resource/Uniform_Resource_Locator + , http://dbpedia.org/resource/Slovak_language + , http://dbpedia.org/resource/Italian_language + , http://dbpedia.org/resource/Arabic + , http://dbpedia.org/resource/Domain_Name_System + , http://dbpedia.org/resource/Dutch_language + , http://dbpedia.org/resource/Estonian_language + , http://dbpedia.org/resource/Web_crawler + , http://dbpedia.org/resource/Ukrainian_language + , http://dbpedia.org/resource/Natural_language_processing + , http://dbpedia.org/resource/World_Wide_Web + , http://dbpedia.org/resource/Lao_language + , http://dbpedia.org/resource/Turkish_language + , http://dbpedia.org/resource/Latvian_language + , http://dbpedia.org/resource/Catalan_language + , http://dbpedia.org/resource/Data_cleansing + , http://dbpedia.org/resource/Japanese_language + , http://dbpedia.org/resource/Domain_name + , http://dbpedia.org/resource/Brno + , http://dbpedia.org/resource/Lithuanian_language + , http://dbpedia.org/resource/Norwegian_language + , http://dbpedia.org/resource/Romanian_language + , http://dbpedia.org/resource/Danish_language + , http://dbpedia.org/resource/Top-level_domain + , http://dbpedia.org/resource/Part_of_speech + , http://dbpedia.org/resource/Masaryk_University + , http://dbpedia.org/resource/HTML + , http://dbpedia.org/resource/Category:Corpora + , http://dbpedia.org/resource/Belarusian_language + , http://dbpedia.org/resource/American_English + , http://dbpedia.org/resource/Website + , http://dbpedia.org/resource/English_language + , http://dbpedia.org/resource/Data_deduplication + , http://dbpedia.org/resource/Hindi + , http://dbpedia.org/resource/Czech_language + , http://dbpedia.org/resource/Simplified_Chinese_characters +
http://dbpedia.org/property/wikiPageUsesTemplate http://dbpedia.org/resource/Template:Corpus_linguistics + , http://dbpedia.org/resource/Template:Columns-list +
http://purl.org/dc/terms/subject http://dbpedia.org/resource/Category:Commercial_digital_libraries + , http://dbpedia.org/resource/Category:Corpora + , http://dbpedia.org/resource/Category:Czech_digital_libraries +
http://www.w3.org/ns/prov#wasDerivedFrom http://en.wikipedia.org/wiki/TenTen_Corpus_Family?oldid=1018803597&ns=0 +
http://xmlns.com/foaf/0.1/isPrimaryTopicOf http://en.wikipedia.org/wiki/TenTen_Corpus_Family +
owl:sameAs http://www.wikidata.org/entity/Q30325593 + , http://uk.dbpedia.org/resource/%D0%A1%D1%96%D0%BC%D0%B5%D0%B9%D1%81%D1%82%D0%B2%D0%BE_%D0%BA%D0%BE%D1%80%D0%BF%D1%83%D1%81%D1%96%D0%B2_%D0%A2%D0%B5%D0%BD%D0%A2%D0%B5%D0%BD + , http://dbpedia.org/resource/TenTen_Corpus_Family + , https://global.dbpedia.org/id/2p3c1 +
rdfs:comment The TenTen Corpus Family (also called TenTThe TenTen Corpus Family (also called TenTen corpora) is a set of comparable web text corpora, i.e. collections of texts that have been crawled from the World Wide Web and processed to match the same standards. These corpora are made available through the Sketch Engine corpus manager. There are TenTen corpora for more than 35 languages. Their target size is 10 billion (1010) words per language, which gave rise to the corpus family's name.ich gave rise to the corpus family's name. , Родина корпусів ТенТен (англ. The TenTen CРодина корпусів ТенТен (англ. The TenTen Corpus Family) — це сукупність порівняльних веб-корпусів, укладених з лінгвістично вартісних текстів всесвітньої павутини. Доступ до корпусів реалізовано через корпусний менеджер Sketch Engine. Інструментарій цієї веб-платформи дає змогу детально досліджувати граматику, лексику та термінологію, аналізувати переклади, укладати частотні словники. До родини ТенТен входять корпуси 42 мов (за даними на квітень 2022). Цільовий розмір кожного з корпусів становить 10 мільярдів (1010) слововживань, це число й дало їм назву (1010 — «ten-ten»). число й дало їм назву (1010 — «ten-ten»).
rdfs:label Сімейство корпусів ТенТен , TenTen Corpus Family
hide properties that link here 
http://dbpedia.org/resource/Tenten + http://dbpedia.org/ontology/wikiPageDisambiguates
http://dbpedia.org/resource/TenTen_corpora + http://dbpedia.org/ontology/wikiPageRedirects
http://dbpedia.org/resource/Sketch_Engine + , http://dbpedia.org/resource/Tenten + , http://dbpedia.org/resource/SkELL + , http://dbpedia.org/resource/TenTen_corpora + , http://dbpedia.org/resource/The_TenTen_Corpus_Family + http://dbpedia.org/ontology/wikiPageWikiLink
http://en.wikipedia.org/wiki/TenTen_Corpus_Family + http://xmlns.com/foaf/0.1/primaryTopic
http://dbpedia.org/resource/TenTen_Corpus_Family + owl:sameAs
 

 

Enter the name of the page to start semantic browsing from.