Kako preuzeti i instalirati NLTK na Windows/Mac

Instaliranje NLTK-a u Windows

U ovom ฤ‡emo dijelu nauฤiti kako postaviti NLTK putem terminala (Command prompt u Windowsima).

Dolje navedene upute temelje se na pretpostavci da nemate instaliran python. Dakle, prvi korak je instalirati python.

Instaliranje Python in Windows

Korak 1) Idi na vezu https://www.python.org/downloads/, i odaberite najnoviju verziju za Windows.

Instaliranje Python in Windows

biljeลกke: Ako ne ลพelite preuzeti najnoviju verziju, moลพete posjetiti karticu za preuzimanje i vidjeti sva izdanja.

Instaliranje Python in Windows

Korak 2) Kliknite na Preuzetu datoteku

Instaliranje Python in Windows

Korak 3)Odaberite Prilagodi instalaciju

Instaliranje Python in Windows

Korak 4) Pritisnite DALJE

Instaliranje Python in Windows

Korak 5) Na sljedeฤ‡em ekranu

  1. Odaberite napredne opcije
  2. Dajte prilagoฤ‘enu lokaciju za instalaciju. U mom sluฤaju, mapa na pogonu C odabrana je radi lakลกeg rada
  3. Kliknite Instaliraj

Instaliranje Python in Windows

Korak 6) Kliknite gumb Zatvori kada instalacija zavrลกi.

Instaliranje Python in Windows

Korak 7) Kopirajte putanju svoje mape Skripte.

Instaliranje Python in Windows

Korak 8) U Windows naredbenom retku

  • Doฤ‘ite do lokacije mape pip
  • Unesite naredbu za instalaciju NLTK-a
    pip3 install nltk
  • Instalacija bi trebala biti uspjeลกno obavljena

Instaliranje Python in Windows

BILJEล KA: Za Python2 koristite naredbu pip2 install nltk

Korak 9) In Windows Izbornik Start, pretraลพite i otvorite PythonLjuska

Instaliranje Python in Windows

Korak 10) Moลพete provjeriti je li instalacija toฤna uvoฤ‘enjem donje naredbe

import nltk

Instaliranje Python in Windows

Ako ne vidite nikakvu greลกku, instalacija je dovrลกena.

Instaliranje NLTK-a u Mac/Linux

Instaliranje NLTK-a u Mac/Unix zahtijeva python upravitelj paketa pip za instaliranje nltk-a. Ako pip nije instaliran, slijedite upute u nastavku da biste dovrลกili postupak

Korak 1) Aลพurirajte indeks paketa upisivanjem donje naredbe

sudo apt update

Korak 2) Instalacija pip za Python 3:

sudo apt install python3-pip

Takoฤ‘er moลพete instalirati pip koristeฤ‡i easy_install.

sudo apt-get install python-setuptools  python-dev build-essential

Sada je easy_install instaliran. Pokrenite naredbu u nastavku da biste instalirali pip

sudo easy_install pip

Korak 3)Koristite sljedeฤ‡u naredbu za instalaciju NLTK-a

sudo pip install -U nltk
sudo pip3 install -U nltk

Instaliranje NLTK-a kroz Anacondu

Korak 1) Molimo instalirajte anacondu (koja se takoฤ‘er moลพe koristiti za instaliranje razliฤitih paketa) posjetom https://www.anaconda.com/products/individual i odaberite koju verziju pythona trebate instalirati za anacondu.

Instaliranje NLTK-a kroz Anacondu

Napomena: Pogledajte ovaj vodiฤ za detaljne korake za instaliraj anacondu

Korak 2)U odzivniku Anaconda,

  1. Unesite naredbu
    conda install -c anaconda nltk
  2. Revtj. pogledajte paket nadogradite, vratite na niลพu verziju, informacije o instalaciji i unesite yes
  3. NLTK je preuzet i instaliran

Instaliranje NLTK-a kroz Anacondu

Skup podataka NLTK

NLTK modul ima mnogo dostupnih skupova podataka koje morate preuzeti da biste ih koristili. Tehniฤki se to zove zbirka. Neki od primjera su zaustavne rijeฤi, Gutenberg, framenet_v15, velike_gramatikei tako dalje.

Kako preuzeti sve pakete NLTK-a

Korak 1)Pokreni Python tumaฤ in Windows ili Linux

Korak 2)

  1. Unesite naredbe
import nltk
nltk.download ()
  1. Otvara se prozor za preuzimanje NLTK-a. Kliknite gumb Preuzmi za preuzimanje skupa podataka. Ovaj ฤ‡e postupak potrajati, ovisno o vaลกoj internetskoj vezi

Preuzmite sve pakete NLTK-a

NAPOMENA: Moลพete promijeniti lokaciju preuzimanja klikom na Datoteka> Promjena direktorija preuzimanja

Preuzmite sve pakete NLTK-a

Korak 3) Za testiranje instaliranih podataka koristite sljedeฤ‡i kod

>>> from nltk.corpus import brown
>>>brown.words()

['The', 'Fulton', 'County', 'Grand', 'Jury', 'said', โ€ฆ]

Preuzmite sve pakete NLTK-a

Pokretanje NLP skripte

Razgovarat ฤ‡emo o tome kako ฤ‡e se NLP skripta izvrลกavati na naลกem lokalnom raฤunalu. Na trลพiลกtu postoje mnoge knjiลพnice za obradu prirodnog jezika. Dakle, odabir knjiลพnice ovisi o vaลกim zahtjevima. Ovdje je popis NLP knjiลพnice.

Kako pokrenuti NLTK skriptu

Korak 1) U svom omiljenom ureฤ‘ivaฤu koda kopirajte kod i spremite datoteku kao "NLTKsample.py "

from nltk.tokenize import RegexpTokenizer
tokenizer = RegexpTokenizer(r'\w+')
filterdText=tokenizer.tokenize('Hello Guru99, You have build a very good site and I love visiting your site.')
print(filterdText)

Pokrenite NLTK skriptu

Objaลกnjenje koda:

  1. U ovom programu cilj je bio ukloniti sve vrste interpunkcijskih znakova iz zadanog teksta. Uvezli smo "RegexpTokenizer" koji je modul NLTK. Uklanja sve izraze, simbole, znakove, brojeve ili bilo ลกto ลกto god ลพelite.
  2. Upravo ste proslijedili regularni izraz u modul โ€œRegexpTokenizerโ€.
  3. Nadalje, tokenizirali smo rijeฤ pomoฤ‡u modula "tokenize". Izlaz je pohranjen u varijabli "filterdText".
  4. I ispisao ih pomoฤ‡u "print()."

Korak 2) U naredbenom retku

  • Doฤ‘ite do mjesta gdje ste spremili datoteku
  • Pokrenite naredbu Python NLTKsample.py

Pokrenite NLTK skriptu

Ovo ฤ‡e prikazati izlaz kao:

['Zdravo', 'Guru99', 'Vi', 'imate', 'gradite', 'a', 'vrlo', 'dobro', 'stranica', 'i', 'ja', 'ljubav', ' posjeฤ‡ivanje', 'vaลกa', 'stranica']

Saลพmite ovu objavu uz: