Browse Wiki & Semantic Web

Http://dbpedia.org/resource/Stop word

	This page has no properties.

hide properties that link here

	No properties link to this page.

http://dbpedia.org/resource/Stop_word

http://dbpedia.org/ontology/abstract	Na computação, uma palavra vazia (ou stop … Na computação, uma palavra vazia (ou stop word, em inglês) é uma palavra que é removida antes ou após o processamento de um texto em linguagem natural. Não existe uma lista universal de palavras vazias usadas por todas as ferramentas de processamento de linguagem natural e nem todas ferramentas fazem uso de uma lista dessas palavras. Algumas ferramentas, inclusive, evitam remover as chamadas "palavras vazias" para dar suporte à busca de sentenças. Qualquer grupo de palavras pode ser escolhido como grupo de "palavras vazias" de acordo com o objetivo do processamento. Para alguns motores de busca, são selecionadas como palavras vazias as palavras mais comuns da língua e , como o, a, em e no. Embora a utilização de palavras vazias possa simplificar a análise do texto, o uso delas pode causar problemas por impedir a distinção de nomes que fazem uso delas para formar alguma entidade representativa do discurso, como em 'O Teatro Mágico', 'A Bela e a Fera' e 'Firefox OS'. Outros motores de busca removem as palavras mais comuns da busca com o intuito de melhorar o desempenho das buscas.tuito de melhorar o desempenho das buscas. , Stop lista (ang. stop word) – lista słów o … Stop lista (ang. stop word) – lista słów odrzucanych przez wyszukiwarki internetowe w celu zredukowania wielkości zbiorów. Są to słowa o małym znaczeniu (spójniki: i, oraz, lub) oraz słowa popularne (mp3, sex), czyli niewpływające na identyfikację dokumentu. Listy takie można utworzyć dla określonej dziedziny lub dla określonego języka. Istnieją stop-listy dla języka angielskiego, zawierające ok. 450 słów. Usuwanie wyrazów nieznaczących z tekstu może się odbywać w następujący sposób: * słownikowy – z tekstu usuwane są wyrazy wymienione w specjalnym słowniku, * statystyczny – z tekstu usuwane są wyrazy, których częstość występowania znajduje się w założonym przedziale, * hybrydowy – połączenie powyższych technik.hybrydowy – połączenie powyższych technik. , Jako stopslova se při počítačovém zpracová … Jako stopslova se při počítačovém zpracování přirozeného jazyka označují slova, která se v daném jazyce vyskytují často, ale nenesou žádnou významovou informaci, mají zpravidla pouze syntaktický význam. Typicky se jedná o spojky, předložky atp. Seznam takových slov (též označovaný jako negativní slovník) používají plnotextové vyhledávače a při sestavování indexu tato slova zcela ignorují, neboť jsou pro vyhledávání neužitečná. I při jiných formách počítačového zpracování textových dokumentů se stopslova často vypouštějí, neboť tak dojde jak ke zmenšení zpracovávaného dokumentu, tak i ke zkrácení doby nutné pro jeho zpracování. Při použití lemmatizace může slovník obsahovat pouze základní tvary, v opačném případě musí obsahovat všechny používané tvary stopslov. V češtině mezi stopslova mohou být zařazeny např. spojky (a, aby, ale, ani, …), předložky (na, pro, u, …), zájmena (její, my, on), málovýznamová slovesa (být, mít). V jiných jazycích patří mezi typická stopslova také určité a neurčité členy. V konkrétních kontextech často mezi stopslova bývají zařazena slova v daném kontextu příliš častá (např. při vyhledávání na WWW tak jsou často ignorována slova jako www či com). Za vynálezce stopslov bývá považován .m). Za vynálezce stopslov bývá považován . , Stop words are the words in a stop list (o … Stop words are the words in a stop list (or stoplist or negative dictionary) which are filtered out (i.e. stopped) before or after processing of natural language data (text) because they are insignificant. There is no single universal list of stop words used by all natural language processing tools, nor any agreed upon rules for identifying stop words, and indeed not all tools even use such a list. Therefore, any group of words can be chosen as the stop words for a given purpose. The "general trend in [information retrieval] systems over time has been from standard use of quite large stop lists (200–300 terms) to very small stop lists (7–12 terms) to no stop list whatsoever". (7–12 terms) to no stop list whatsoever". , En recherche d'information, un mot vide (o … En recherche d'information, un mot vide (ou stop word, en anglais) est un mot qui est tellement commun qu'il est inutile de l'indexer ou de l'utiliser dans une recherche. En français, des mots vides évidents pourraient être « le », « la », « de », « du », « ce »… Un mot vide est un mot non significatif figurant dans un texte. On l'oppose à mot plein.La signification d'un mot s'évalue à partir de sa distribution (au sens statistique) dans une collection de textes. Un mot est dit « vide » si sa distribution est uniforme sur les textes de la collection. En d'autres termes, un mot qui apparaît avec une fréquence semblable dans chacun des textes de la collection n'est pas discriminant car il ne permet pas de distinguer les textes les uns par rapport aux autres. Lorsque tous les textes de la collection sont rédigés dans une même langue, les mots vides sont principalement des mots caractéristiques de cette langue comme les prépositions, les articles, les pronoms. D'où l'assimilation courante entre mots vides et mots grammaticaux et partant, entre mots pleins et mots lexicaux (noms, verbes, adjectifs). Les listes préétablies, dites de mots vides, utilisées par les moteurs de recherche sont ainsi des listes de mots grammaticaux. Elles sont parfois appelées « anti-dictionnaires ». Cependant dans une collection de textes réunis autour d'un thème commun, certains mots peuvent respecter une distribution uniforme. Ce sont alors des mots vides pour cette collection bien qu'ils ne soient pas des mots grammaticaux. D'autre part, certains mots grammaticaux sont assez rares pour constituer des mots pleins : via par exemple.stituer des mots pleins : via par exemple. , Stoppord är betydelsefattiga ord som förekommer i nästan alla texter och därför ibland ignoreras/filtreras bort i textsökning, indexering och andra språkteknologiska sammanhang. Några svenska exempel är i, och, eller, men, en, ett och att. , Palabras vacías es el nombre que reciben l … Palabras vacías es el nombre que reciben las palabras sin significado como artículos, pronombres, preposiciones, etc. que son filtradas antes o después del procesamiento de datos en lenguaje natural (texto). A Hans Peter Luhn, uno de los pioneros en recuperación de información, se le atribuye la acuñación de la locución inglesa stop words y el uso del concepto en su diseño. Está controlada por introducción humana y no automática. No hay una lista definitiva de palabras vacías que todas las herramientas de procesamiento de lenguajes naturales incorporen. No todas las herramientas de procesamiento de lenguajes naturales usan una lista de palabras vacías. Algunas herramientas evitan usarlo específicamente para soportar búsquedas por frase. El uso de un algoritmo de stemming puede reducir parte de la base lógica o dependencia de una lista de palabras vacías a filtrar. Las palabras vacías pueden causar problemas al usar un motor de búsqueda para buscar frases que las incluyen, especialmente en nombres como 'La verdad' o 'Nunca Jamás'. nombres como 'La verdad' o 'Nunca Jamás'. , 在信息检索中，为节省存储空间和提高搜索效率，在自然语言处理数据（或文本）之前或之后会 … 在信息检索中，为节省存储空间和提高搜索效率，在自然语言处理数据（或文本）之前或之后会自动过滤掉某些字或词，这些字或词即被称为Stop Words(停用词)。不要把停用词与安全口令混淆。这些停用词都是人工输入、非自动化生成的，生成后的停用词会形成一个停用词表。但是，并没有一个明确的停用词表能够适用于所有的工具。甚至有一些工具是明确地避免使用停用词来支持的。对于一个给定的目的，任何一类的词语都可以被选作停用词。通常意义上，停用词大致分为两类。一类是人类语言中包含的功能词，这些功能词极其普遍，与其他词相比，功能词没有什么实际含义，比如'the'、'is'、'at'、'which'、'on'等。但是对于搜索引擎来说，当所要搜索的短语包含功能词，特别是像The Who、The The或Take That等复合名词时，停用词的使用就会导致问题。另一类词包括词汇词，比如'want'等，这些词应用十分广泛，但是对这样的词搜索引擎无法保证能够给出真正相关的搜索结果，难以帮助缩小搜索范围，同时还会降低搜索的效率，所以通常会把这些词从问题中移去，从而提高搜索性能。作为信息检索的先驱者之一，创造了这个短语，并在他的研究中应用这个概念，推动了这个概念的使用。检索的先驱者之一，创造了这个短语，并在他的研究中应用这个概念，推动了这个概念的使用。 , Стоп-слова, или Шумовые слова, — термин из … Стоп-слова, или Шумовые слова, — термин из теории поиска информации по ключевым словам. Стоп-слова могут делиться на общие и зависимые. К общим можно отнести предлоги, суффиксы, причастия, междометия, цифры, частицы и т. п. Общие шумовые слова всегда исключаются из поискового запроса (за исключением поиска по строгому соответствию поисковой фразы), также они игнорируются при построении инвертированного индекса. Считается, что каждое из общих стоп-слов есть почти во всех документах коллекции. Зависимые стоп-слова зависят от поисковой фразы. Идея заключается в том, чтобы по-разному учитывать отсутствие просто слов из запроса и зависимых стоп-слов из запроса в найденном документе. Например, при поиске по запросу Пушкин Александр Сергеевич, есть смысл отобразить все документы содержащие: * Пушкин, Александр, Сергеевич * Пушкин, Александр * Пушкин, Сергеевич * Пушкин Но вряд ли есть смысл отображать документы, содержащие только: * Александр, Сергеевич * Александр * Сергеевич То есть в данном запросе шумовыми словами являются Александр и Сергеевич. Зависимые стоп-слова отличаются тем, что в поисковом запросе их следует учитывать только при наличии в искомом документе значимых ключевых слов. искомом документе значимых ключевых слов. , Stoppwörter nennt man in der Informationsr … Stoppwörter nennt man in der Informationsrückgewinnung bzw. im Information Retrieval Wörter, die bei einer Volltextindexierung nicht beachtet werden, da sie sehr häufig auftreten und gewöhnlich keine Relevanz für die Erfassung des Dokumentinhalts besitzen. Die Stoppwörter befanden sich bei älteren Suchmaschinen gewöhnlich auf einer Liste und wurden aus dem Text entfernt und nicht indexiert. Heute basieren die meisten Internet-Suchmaschinen auf Vollindexierung, dabei werden die Stoppwörter angezeigt, tragen aber nichts zur Suche bei. Es handelt sich üblicherweise bei den Stoppwörtern um die am häufigsten vorkommenden Wörter einer Sprache. Man spricht dann auch von einer „festen Stoppwortliste“. Allen Stoppwörtern ist gemeinsam, dass sie vor allem grammatikalische/syntaktische Funktionen übernehmen und daher keine Rückschlüsse auf den Inhalt des Dokumentes zulassen. Eine weitere Gemeinsamkeit ist ihre große Zahl: Sie treten in jedem Dokument sehr oft auf und kommen in sehr vielen Dokumenten vor, wodurch sie bei der Erschließung der Dokumente einen hohen Aufwand verursachen würden. Handelt es sich um die am häufigsten vorkommenden Wörter einer Menge von Dokumenten (beispielsweise Akten und Berichte) spricht man von einer „berechneten Stoppwortliste“. Das Erkennen von Stoppwörtern macht Suchmaschinen effizienter. Würde man Stoppwörter bei einem Suchauftrag beachten, wäre nahezu jedes Dokument ein Treffer. Ein solches Suchergebnis wäre für den Anwender nutzlos. Allerdings ist es nicht immer sinnvoll, Stoppwörter komplett auszublenden. Beispiele hierfür sind im Englischen die Rockgruppe „The Who“ oder im Deutschen „Die Ärzte“ und Personen mit dem Nachnamen „Weil“. Daher ist es heute, bei Vollindizierung, möglich auch nach diesen Kombinationen suchen zu lassen. Früher war dazu bei den meisten Suchmaschinen ein Operator notwendig, zum Beispiel „+“ oder die Phrasensuche. Allgemein übliche Stoppwörter in deutschsprachigen Dokumenten sind bestimmte Artikel ('der', 'die', 'das'), unbestimmte Artikel ('einer', 'eine', 'ein'), Konjunktionen (z. B. 'und', 'oder', 'doch', 'weil') und häufig gebrauchte Präpositionen (z. B. 'an', 'in', 'von') sowie die Negation 'nicht'. Im Englischen sind unter anderem 'a', 'of', 'the', 'I', 'it', 'you' und 'and' Stoppwörter. Abhängig von den zu erschließenden Dokumenten können Stoppwörter auch mehrsprachig vorliegen. Obwohl eher als Stoppzeichen zu benennen, werden häufig auch der Punkt (.), das Komma und der Strichpunkt als Stoppwörter bezeichnet. In der freien Software-Bibliothek NLTK sind Listen von Stoppwörtern für 21 Sprachen sowie fertige Methoden zu deren Benutzung enthalten. Hans Peter Luhn, einer der Pioniere des Information Retrieval, prägte den Begriff der Stoppwörter und benutzte dieses Konzept im Design und in der Implementation des Indexers KWIC. Abzugrenzen ist das Stoppwort von den sogenannten Black Lists, dabei handelt es sich um eine Liste von unzulässigen Wörtern. Das Vorkommen eines solchen führt nicht zum Ausschluss des Wortes aus der Indizierung, sondern zur Elimination des gesamten Dokuments.rn zur Elimination des gesamten Dokuments. , Dins la informàtica, les paraules buides o … Dins la informàtica, les paraules buides o mots buits són llistes de paraules que es filtren durant el processament del llenguatge natural. No hi ha cap llista universal de paraules buides que s'utilitzi en totes les eines de processament de llenguatge natural, i de fet no totes les eines utilitzen una llista així. Fins i tot, algunes eines eviten eliminar les paraules buides per tal de permetre, per exemple, la cerca de frases. Qualsevol grup de paraules pot ser candidat a paraules buides per a cert propòsit. Per a alguns motors de cerca, algunes de les més comunes són preposicions o articles com de, per, el, la o amb. Això pot causar problemes a l'hora de cercar frases que els incloguin, particularment noms propis, com per exemple Charles de Gaulle, o l'Edat de pedra. Altres motors de cerca treuen alguns de les paraules més comunes — incloent-hi paraules lèxiques, com «ser» — d'una cerca per tal de millorar el rendiment. Per la xarxa es poden trobar diverses llistes de paraules buides per al catalàs llistes de paraules buides per al català , Стоп-слова або шумові слова — термін з теорії пошуку інформації за ключовими словами. Це слова, які не несуть смислового навантаження, тому їх користь та роль для пошуку не суттєва. , الكلمات الشائعة (بالإنجليزية: stop words)‏ … الكلمات الشائعة (بالإنجليزية: stop words)‏ أو الكلمات المستبعدة هي الكلمات التي تستبعد قبل المعالجة اللغوية الآلية للبيانات (نصوص). وهي الكلمات التي تتكرر في النصوص مثل (في، من، إلى...) ويستحسن تجاهلها وعدم فهرستها من أجل تحسين البحث. ويرجع الفضل (من الرواد في استرجاع المعلومات) في استعمال هذا المصطلح والمفهوم في التطوير. وتعتبر هذه الطريقة مقاربة سلبية في التعامل مع الأدوات وحروف المعاني في الجمل.لا توجد قائمة كلمات محددة للاستبعاد، تستعملها كل المحللات الصرفية وأدوات معالجة اللغة الطبيعية. لا تستعمل كل أدوات المعالجة اللغوية قائمة كلمات شائعة.ويمكن للتحليل الصرفي التقليل من استخدام كلمات مستبعدة، لا سيما عند تحليل الجمل.الكلمات المستبعدة قد تسبب مشاكل عند استخدام محرك بحث للبحث عن العبارات التي تدخل فيها، لا سيما في أسماء مثل 'المفعول به'، أو «رسول من الله»، «وهم».ثل 'المفعول به'، أو «رسول من الله»، «وهم».
http://dbpedia.org/ontology/wikiPageExternalLink	https://www.textfixer.com/resources/common-english-words.txt + , https://archive.today/20130210071035/http:/aniol-consulting.de/uebersicht-deutscher-stop-words/ + , http://www.techie-knowledge.co.in/2018/07/stop-words-in-hindi-language.html + , https://e-padi.com/stop-words-indonesia-query-php-array.htm + , https://tcpip.wtf/en/deutsche-stopwords.htm + , https://dev.mysql.com/doc/refman/5.5/en/fulltext-stopwords.html + , https://web.archive.org/web/%2A/http:/tonyb.sk/_my/ir/stop-words-collection-2014-02-24.zip + , https://code.google.com/p/stop-words/ + , https://xpo6.com/list-of-english-stop-words/ + , https://web.archive.org/web/20100308021834/http:/www.ranks.nl/stopwords/german.html +
http://dbpedia.org/ontology/wikiPageID	1015600
http://dbpedia.org/ontology/wikiPageLength	8555
http://dbpedia.org/ontology/wikiPageRevisionID	1120852254
http://dbpedia.org/ontology/wikiPageWikiLink	http://dbpedia.org/resource/To_be_or_not_to_be + , http://dbpedia.org/resource/Concept_mining + , http://dbpedia.org/resource/Search_engine_indexing + , http://dbpedia.org/resource/Function_words + , http://dbpedia.org/resource/Text_mining + , http://dbpedia.org/resource/Bible_concordance + , http://dbpedia.org/resource/Query_expansion + , http://dbpedia.org/resource/Search_engine_optimization + , http://dbpedia.org/resource/The_The + , http://dbpedia.org/resource/Web_crawler + , http://dbpedia.org/resource/Hans_Peter_Luhn + , http://dbpedia.org/resource/Isaac_Nathan_ben_Kalonymus + , http://dbpedia.org/resource/Lexical_word + , http://dbpedia.org/resource/Filler_%28linguistics%29 + , http://dbpedia.org/resource/Search_engine + , http://dbpedia.org/resource/Function_word + , http://dbpedia.org/resource/Machine_learning + , http://dbpedia.org/resource/Category:Information_retrieval_techniques + , http://dbpedia.org/resource/Information_retrieval + , http://dbpedia.org/resource/Take_That + , http://dbpedia.org/resource/Index_%28search_engine%29 + , http://dbpedia.org/resource/Information_extraction + , http://dbpedia.org/resource/The_Who + , http://dbpedia.org/resource/Stemming + , http://dbpedia.org/resource/Natural_language_processing +
http://dbpedia.org/property/wikiPageUsesTemplate	http://dbpedia.org/resource/Template:SearchEngineOptimization + , http://dbpedia.org/resource/Template:Reflist + , http://dbpedia.org/resource/Template:Natural_Language_Processing + , http://dbpedia.org/resource/Template:Short_description +
http://purl.org/dc/terms/subject	http://dbpedia.org/resource/Category:Information_retrieval_techniques +
http://www.w3.org/ns/prov#wasDerivedFrom	http://en.wikipedia.org/wiki/Stop_word?oldid=1120852254&ns=0 +
http://xmlns.com/foaf/0.1/isPrimaryTopicOf	http://en.wikipedia.org/wiki/Stop_word +
owl:sameAs	http://cs.dbpedia.org/resource/Stopslovo + , http://hi.dbpedia.org/resource/%E0%A4%85%E0%A4%B5%E0%A4%B0%E0%A5%81%E0%A4%A6%E0%A5%8D%E0%A4%A7_%E0%A4%B6%E0%A4%AC%E0%A5%8D%E0%A4%A6 + , http://www.wikidata.org/entity/Q80735 + , http://pl.dbpedia.org/resource/Stop_lista_%28wyszukiwarki%29 + , http://bar.dbpedia.org/resource/Stoppweata + , http://tr.dbpedia.org/resource/Etkisiz_kelimeler + , http://ca.dbpedia.org/resource/Paraules_buides + , http://es.dbpedia.org/resource/Palabra_vac%C3%ADa + , http://ru.dbpedia.org/resource/%D0%A8%D1%83%D0%BC%D0%BE%D0%B2%D1%8B%D0%B5_%D1%81%D0%BB%D0%BE%D0%B2%D0%B0 + , http://uk.dbpedia.org/resource/%D0%A8%D1%83%D0%BC%D0%BE%D0%B2%D1%96_%D1%81%D0%BB%D0%BE%D0%B2%D0%B0 + , http://dbpedia.org/resource/Stop_word + , http://sv.dbpedia.org/resource/Stoppord_%28spr%C3%A5kteknologi%29 + , http://vi.dbpedia.org/resource/T%E1%BB%AB_d%E1%BB%ABng + , http://fa.dbpedia.org/resource/%D9%88%D8%A7%DA%98%D9%87_%D9%BE%D8%A7%D9%84%D8%A7%DB%8C%D8%B4%DB%8C_%28%D9%BE%D8%B1%D8%AF%D8%A7%D8%B2%D8%B4_%D8%B2%D8%A8%D8%A7%D9%86_%D8%B7%D8%A8%DB%8C%D8%B9%DB%8C%29 + , http://sk.dbpedia.org/resource/Stop_slovo + , http://he.dbpedia.org/resource/%D7%9E%D7%99%D7%9C%D7%AA_%D7%A2%D7%A6%D7%99%D7%A8%D7%94 + , http://de.dbpedia.org/resource/Stoppwort + , https://global.dbpedia.org/id/4xGGX + , http://ar.dbpedia.org/resource/%D8%A7%D8%B3%D8%AA%D8%A8%D8%B9%D8%A7%D8%AF_%D8%A7%D9%84%D9%83%D9%84%D9%85%D8%A7%D8%AA_%D8%A7%D9%84%D8%B4%D8%A7%D8%A6%D8%B9%D8%A9 + , http://pt.dbpedia.org/resource/Palavra_vazia + , http://fr.dbpedia.org/resource/Mot_vide + , http://zh.dbpedia.org/resource/%E5%81%9C%E7%94%A8%E8%AF%8D +
rdfs:comment	Stop lista (ang. stop word) – lista słów o … Stop lista (ang. stop word) – lista słów odrzucanych przez wyszukiwarki internetowe w celu zredukowania wielkości zbiorów. Są to słowa o małym znaczeniu (spójniki: i, oraz, lub) oraz słowa popularne (mp3, sex), czyli niewpływające na identyfikację dokumentu. Listy takie można utworzyć dla określonej dziedziny lub dla określonego języka. Istnieją stop-listy dla języka angielskiego, zawierające ok. 450 słów. Usuwanie wyrazów nieznaczących z tekstu może się odbywać w następujący sposób:stu może się odbywać w następujący sposób: , Стоп-слова, или Шумовые слова, — термин из … Стоп-слова, или Шумовые слова, — термин из теории поиска информации по ключевым словам. Стоп-слова могут делиться на общие и зависимые. К общим можно отнести предлоги, суффиксы, причастия, междометия, цифры, частицы и т. п. Общие шумовые слова всегда исключаются из поискового запроса (за исключением поиска по строгому соответствию поисковой фразы), также они игнорируются при построении инвертированного индекса. Считается, что каждое из общих стоп-слов есть почти во всех документах коллекции. * Пушкин, Александр, Сергеевич * Пушкин, Александр * Пушкин, Сергеевич * Пушкин, Александр * Пушкин, Сергеевич * Пушкин , Jako stopslova se při počítačovém zpracová … Jako stopslova se při počítačovém zpracování přirozeného jazyka označují slova, která se v daném jazyce vyskytují často, ale nenesou žádnou významovou informaci, mají zpravidla pouze syntaktický význam. Typicky se jedná o spojky, předložky atp. Seznam takových slov (též označovaný jako negativní slovník) používají plnotextové vyhledávače a při sestavování indexu tato slova zcela ignorují, neboť jsou pro vyhledávání neužitečná. Při použití lemmatizace může slovník obsahovat pouze základní tvary, v opačném případě musí obsahovat všechny používané tvary stopslov.bsahovat všechny používané tvary stopslov. , En recherche d'information, un mot vide (o … En recherche d'information, un mot vide (ou stop word, en anglais) est un mot qui est tellement commun qu'il est inutile de l'indexer ou de l'utiliser dans une recherche. En français, des mots vides évidents pourraient être « le », « la », « de », « du », « ce »…re « le », « la », « de », « du », « ce »… , Стоп-слова або шумові слова — термін з теорії пошуку інформації за ключовими словами. Це слова, які не несуть смислового навантаження, тому їх користь та роль для пошуку не суттєва. , Stop words are the words in a stop list (o … Stop words are the words in a stop list (or stoplist or negative dictionary) which are filtered out (i.e. stopped) before or after processing of natural language data (text) because they are insignificant. There is no single universal list of stop words used by all natural language processing tools, nor any agreed upon rules for identifying stop words, and indeed not all tools even use such a list. Therefore, any group of words can be chosen as the stop words for a given purpose. The "general trend in [information retrieval] systems over time has been from standard use of quite large stop lists (200–300 terms) to very small stop lists (7–12 terms) to no stop list whatsoever". (7–12 terms) to no stop list whatsoever". , Stoppwörter nennt man in der Informationsr … Stoppwörter nennt man in der Informationsrückgewinnung bzw. im Information Retrieval Wörter, die bei einer Volltextindexierung nicht beachtet werden, da sie sehr häufig auftreten und gewöhnlich keine Relevanz für die Erfassung des Dokumentinhalts besitzen. Die Stoppwörter befanden sich bei älteren Suchmaschinen gewöhnlich auf einer Liste und wurden aus dem Text entfernt und nicht indexiert. Heute basieren die meisten Internet-Suchmaschinen auf Vollindexierung, dabei werden die Stoppwörter angezeigt, tragen aber nichts zur Suche bei.gezeigt, tragen aber nichts zur Suche bei. , الكلمات الشائعة (بالإنجليزية: stop words)‏ … الكلمات الشائعة (بالإنجليزية: stop words)‏ أو الكلمات المستبعدة هي الكلمات التي تستبعد قبل المعالجة اللغوية الآلية للبيانات (نصوص). وهي الكلمات التي تتكرر في النصوص مثل (في، من، إلى...) ويستحسن تجاهلها وعدم فهرستها من أجل تحسين البحث. ويرجع الفضل (من الرواد في استرجاع المعلومات) في استعمال هذا المصطلح والمفهوم في التطوير.ي استعمال هذا المصطلح والمفهوم في التطوير. , Palabras vacías es el nombre que reciben l … Palabras vacías es el nombre que reciben las palabras sin significado como artículos, pronombres, preposiciones, etc. que son filtradas antes o después del procesamiento de datos en lenguaje natural (texto). A Hans Peter Luhn, uno de los pioneros en recuperación de información, se le atribuye la acuñación de la locución inglesa stop words y el uso del concepto en su diseño. Está controlada por introducción humana y no automática.a por introducción humana y no automática. , Stoppord är betydelsefattiga ord som förekommer i nästan alla texter och därför ibland ignoreras/filtreras bort i textsökning, indexering och andra språkteknologiska sammanhang. Några svenska exempel är i, och, eller, men, en, ett och att. , 在信息检索中，为节省存储空间和提高搜索效率，在自然语言处理数据（或文本）之前或之后会 … 在信息检索中，为节省存储空间和提高搜索效率，在自然语言处理数据（或文本）之前或之后会自动过滤掉某些字或词，这些字或词即被称为Stop Words(停用词)。不要把停用词与安全口令混淆。这些停用词都是人工输入、非自动化生成的，生成后的停用词会形成一个停用词表。但是，并没有一个明确的停用词表能够适用于所有的工具。甚至有一些工具是明确地避免使用停用词来支持的。对于一个给定的目的，任何一类的词语都可以被选作停用词。通常意义上，停用词大致分为两类。一类是人类语言中包含的功能词，这些功能词极其普遍，与其他词相比，功能词没有什么实际含义，比如'the'、'is'、'at'、'which'、'on'等。但是对于搜索引擎来说，当所要搜索的短语包含功能词，特别是像The Who、The The或Take That等复合名词时，停用词的使用就会导致问题。另一类词包括词汇词，比如'want'等，这些词应用十分广泛，但是对这样的词搜索引擎无法保证能够给出真正相关的搜索结果，难以帮助缩小搜索范围，同时还会降低搜索的效率，所以通常会把这些词从问题中移去，从而提高搜索性能。作为信息检索的先驱者之一，创造了这个短语，并在他的研究中应用这个概念，推动了这个概念的使用。检索的先驱者之一，创造了这个短语，并在他的研究中应用这个概念，推动了这个概念的使用。 , Na computação, uma palavra vazia (ou stop … Na computação, uma palavra vazia (ou stop word, em inglês) é uma palavra que é removida antes ou após o processamento de um texto em linguagem natural. Não existe uma lista universal de palavras vazias usadas por todas as ferramentas de processamento de linguagem natural e nem todas ferramentas fazem uso de uma lista dessas palavras. Algumas ferramentas, inclusive, evitam remover as chamadas "palavras vazias" para dar suporte à busca de sentenças.as" para dar suporte à busca de sentenças. , Dins la informàtica, les paraules buides o … Dins la informàtica, les paraules buides o mots buits són llistes de paraules que es filtren durant el processament del llenguatge natural. No hi ha cap llista universal de paraules buides que s'utilitzi en totes les eines de processament de llenguatge natural, i de fet no totes les eines utilitzen una llista així. Fins i tot, algunes eines eviten eliminar les paraules buides per tal de permetre, per exemple, la cerca de frases. Per la xarxa es poden trobar diverses llistes de paraules buides per al catalàs llistes de paraules buides per al català
rdfs:label	Шумовые слова , استبعاد الكلمات الشائعة , Palavra vazia , Stop lista (wyszukiwarki) , Mot vide , Stoppord (språkteknologi) , Stopslovo , Palabra vacía , Stoppwort , Stop word , Paraules buides , Шумові слова , 停用词

hide properties that link here

http://dbpedia.org/resource/Stoplist + , http://dbpedia.org/resource/Stop-words + , http://dbpedia.org/resource/Stop_words + , http://dbpedia.org/resource/Stopword + , http://dbpedia.org/resource/Stop_Words + , http://dbpedia.org/resource/Stop-word + , http://dbpedia.org/resource/Stop_list +	http://dbpedia.org/ontology/wikiPageRedirects
http://dbpedia.org/resource/RankBrain + , http://dbpedia.org/resource/POPLINE + , http://dbpedia.org/resource/Text_normalization + , http://dbpedia.org/resource/Stoplist + , http://dbpedia.org/resource/Linsear_Write + , http://dbpedia.org/resource/Stop-words + , http://dbpedia.org/resource/Stop_words + , http://dbpedia.org/resource/Stopword + , http://dbpedia.org/resource/Stop_Words + , http://dbpedia.org/resource/Stop-word + , http://dbpedia.org/resource/Stop_list + , http://dbpedia.org/resource/Stopwords +	http://dbpedia.org/ontology/wikiPageWikiLink
http://en.wikipedia.org/wiki/Stop_word +	http://xmlns.com/foaf/0.1/primaryTopic
http://dbpedia.org/resource/Stop_word +	owl:sameAs

Browse Wiki & Semantic Web

Navigation menu

Personal tools

Namespaces

Variants

Views

Actions

Search

Navigation

Tools