Как да инсталирате NLTK?

Следващата статия Инсталиране на NLTK предоставя контур за инсталиране на NLTK. NLTK е набор от библиотеки за обработка на естествен език. Това е платформа за изграждане на програми на Python за обработка на естествен език. NLTK е написан на езика за програмиране на Python. Той е разработен от Стивън Бърд и Едуард Лопер. Той подпомага изследванията и преподаването в НЛП или тясно свързани области, включително когнитивни науки, емпирична лингвистика, извличане на информация, изкуствен интелект и машинно обучение. NLTK осигурява лесен за използване интерфейс.

NLTK (Наръчник по естествен език)

  • Обработката на естествен език (NLP) е част от изкуствения интелект, който обработва езика, който се говори от хората. По този начин той помага на хората да взаимодействат с компютрите, дори и да нямат познания как да го използват. Използвайки NLP, хората просто трябва да диктуват командата на компютрите. Със силата на машинното обучение, обработката на естествен език става популярна и по-лесна за изпълнение. Основно е техниката за взаимодействие с хора и извършване на действия по гласови команди.
  • Това дава възможност устройствата да се използват дори от начинаещия, който не познава технологиите. Но прилагането на обработката на естествен език не е лесно, тъй като език, който се говори от хората, няма определена структура. Тя е двусмислена и зависи от контекстните думи, които могат да имат различно значение.
  • NLTK има повече от 50 корпорации и лексикални източници, като WordNet, Corpus Report Report, Penn Treebank Corpus и др. Той също така предлага ръководство, което обяснява концепциите за езикова обработка чрез инструментариум и основи на програмиране на Python, което улеснява хората които нямат дълбоки познания по програмиране. Той има широка гама от пакети, което го прави един от мощните инструментариум за NLP. Токенизация, лематизация, стъблане, разбор, брой символи, препинателни знаци, брой думи са някои от тези пакети.

Инсталирайте NLTK за Windows

По-долу са инструкциите за инсталиране на NLTK в Windows. Те се основават на предположението, че Python не е инсталиран в системата. NLTK изисква версии на Python 2.7, 3.5 и по-нови.

Стъпка 1: Изтеглете най-новата версия на Python за Windows от долната връзка

https://www.python.org/downloads/

Стъпка 2: Кликнете върху изтегления .exe, за да го стартирате.

Стъпка 3: Изберете персонализиране на инсталацията.

Стъпка 4: Проверете за всички функции, особено „pip“, тъй като помага да инсталирате NLTK и щракнете върху Next.

Стъпка 5: В следващия екран изберете разширени опции, изберете пътя и щракнете върху инсталиране.

Стъпка 6: След като инсталацията е успешна близо до прозореца.

Стъпка 7: Копирайте пътя на папката Scripts, за да инсталирате NLTK в същата папка.

NLTK може лесно да се инсталира с инсталатор на „pip“. Също така трябва да инсталираме и „numpy“.

Стъпка 8: За да инсталирате NLTK, отворете командния ред и въведете командата отдолу.

Уверете се, че инсталацията е успешна.

След успешната инсталация сега е време да използвате NLTK за обработка на естествен език.

Стъпка 9: Отворете Python Shell и въведете командата отдолу.

Ако се импортира без грешка, това означава, че NLTK е инсталиран правилно.

Инсталирайте NLTK за Mac / Linux

За разлика от Windows, Linux системите предлагат инсталиран Python в него. За да инсталирате NLTK в Linux / Mac, се използва инсталационният пакет на Python за Pip. За да инсталирате pip или да го актуализирате, въведете по-долу команди в командния ред.

За да инсталирате python в Linux, използвайте командите по-долу.

Стъпка 1: За да актуализирате индекса на пакета, използвайте командата по-долу.

Стъпка 2: За да инсталирате Python в Linux, използвайте по-долу.

Стъпка: Въведете командата по-долу, за да инсталирате „pip“ за Python 3.

Стъпка 4: След като „Pip“ е инсталиран успешно, използвайте следните команди, за да инсталирате NLTK.

NLTK набор от данни

NLTK има много набори от данни на разположение за обработка на естествен език, например WordNet, WikiCorpus, Gutenberg, Opinion Lexicon, Tweebank и др. Тези набори от данни се наричат ​​корпорации. По принцип наборът от данни на NLTK съдържа набор от файлове или документи. Всеки файл / документ съдържа колекция от думи, букви или текст на един език. Така корпусът е главно библиотеки за разбиране / изучаване на език. Той има граматически правила и структура на даден език.

След като успешно инсталирате NLTK, можете да го импортирате и също да изтеглите неговите корпуси със следната команда.

Изтеглителят на NLTK отваря прозорец за изтегляне на наборите от данни. Размерът на набора от данни е голям, следователно ще отнеме време. За да проверите дали наборите от данни са инсталирани правилно, опитайте да импортирате набора от данни и да го използвате.

Обработка на NLTK

Има 5 основни процеса на обработка на естествен език. Това са стъпките, свързани с обработката на всеки текст.

  1. EOS Detection : Откриване на края на речта разбива текста в колекция от смислени изречения. Той разделя дългия текст на части, които имат някакво значение.
  2. Токенизация : Тази стъпка разделя изреченията в маркери. Токените не съдържат само думи, но също така включват бели пространства, прекъсвания на изреченията.
  3. Маркиране на POS : POS означава проговор на речта. Тук информацията е присвоена на маркера. Тази информация подсказва какъв тип реч е като напрежение, глагол, прилагателно, съществително и т.н.
  4. Chunking : Chunking означава събиране на текст въз основа на маркери.
  5. Извличане: Извличането е непрекъснат процес на преминаване през парчета и маркиране на тях като именати единици като хора, места, организации и т.н.

Заключение:

NLTK се използва за класификация на текст, надпис на изображения, разпознаване на реч, отговор на въпроси, моделиране на езици, обобщаване на документи и много други операции. Има много други инструменти за обработка на естествен език. Но NLTK има широка гама от библиотеки, което го прави един от мощните инструменти за обработка на естествен език. Той е по-точен от всеки друг инструмент, но поради голям брой библиотеки, той е малко бавен. Така че, всичко зависи от изискванията на потребителя. Ако потребителят иска скорост, тогава може да предпочита и други инструменти, но тогава ще трябва да прави компромиси с точността на съдържанието. Но ако точността е приоритет, те определено трябва да се насочат към NLTK.

Препоръчани статии:

Това е ръководство за инсталиране на NLTK. Тук обсъждаме основната концепция и различните стъпки за инсталиране на NLTK на Windows и Linux \ Mac. Можете също да разгледате следните статии, за да научите повече-

  1. Инсталирайте таблото за управление на Kubernetes
  2. Как да инсталирате JDK
  3. Инсталирайте Docker
  4. Как да инсталирате Magento?
  5. Версии на Magento | Характеристики на Magento версии