Kako preuzeti i instalirati NLTK na Windows/Mac
Instaliranje NLTK-a u Windows
U ovom ฤemo dijelu nauฤiti kako postaviti NLTK putem terminala (Command prompt u Windowsima).
Dolje navedene upute temelje se na pretpostavci da nemate instaliran python. Dakle, prvi korak je instalirati python.
Instaliranje Python in Windows
Korak 1) Idi na vezu https://www.python.org/downloads/, i odaberite najnoviju verziju za Windows.
biljeลกke: Ako ne ลพelite preuzeti najnoviju verziju, moลพete posjetiti karticu za preuzimanje i vidjeti sva izdanja.
Korak 2) Kliknite na Preuzetu datoteku
Korak 3)Odaberite Prilagodi instalaciju
Korak 4) Pritisnite DALJE
Korak 5) Na sljedeฤem ekranu
- Odaberite napredne opcije
- Dajte prilagoฤenu lokaciju za instalaciju. U mom sluฤaju, mapa na pogonu C odabrana je radi lakลกeg rada
- Kliknite Instaliraj
Korak 6) Kliknite gumb Zatvori kada instalacija zavrลกi.
Korak 7) Kopirajte putanju svoje mape Skripte.
Korak 8) U Windows naredbenom retku
- Doฤite do lokacije mape pip
- Unesite naredbu za instalaciju NLTK-a
pip3 install nltk
- Instalacija bi trebala biti uspjeลกno obavljena
BILJEล KA: Za Python2 koristite naredbu pip2 install nltk
Korak 9) In Windows Izbornik Start, pretraลพite i otvorite PythonLjuska
Korak 10) Moลพete provjeriti je li instalacija toฤna uvoฤenjem donje naredbe
import nltk
Ako ne vidite nikakvu greลกku, instalacija je dovrลกena.
Instaliranje NLTK-a u Mac/Linux
Instaliranje NLTK-a u Mac/Unix zahtijeva python upravitelj paketa pip za instaliranje nltk-a. Ako pip nije instaliran, slijedite upute u nastavku da biste dovrลกili postupak
Korak 1) Aลพurirajte indeks paketa upisivanjem donje naredbe
sudo apt update
Korak 2) Instalacija pip za Python 3:
sudo apt install python3-pip
Takoฤer moลพete instalirati pip koristeฤi easy_install.
sudo apt-get install python-setuptools python-dev build-essential
Sada je easy_install instaliran. Pokrenite naredbu u nastavku da biste instalirali pip
sudo easy_install pip
Korak 3)Koristite sljedeฤu naredbu za instalaciju NLTK-a
sudo pip install -U nltk sudo pip3 install -U nltk
Instaliranje NLTK-a kroz Anacondu
Korak 1) Molimo instalirajte anacondu (koja se takoฤer moลพe koristiti za instaliranje razliฤitih paketa) posjetom https://www.anaconda.com/products/individual i odaberite koju verziju pythona trebate instalirati za anacondu.
Napomena: Pogledajte ovaj vodiฤ za detaljne korake za instaliraj anacondu
Korak 2)U odzivniku Anaconda,
- Unesite naredbu
conda install -c anaconda nltk
- Revtj. pogledajte paket nadogradite, vratite na niลพu verziju, informacije o instalaciji i unesite yes
- NLTK je preuzet i instaliran
Skup podataka NLTK
NLTK modul ima mnogo dostupnih skupova podataka koje morate preuzeti da biste ih koristili. Tehniฤki se to zove zbirka. Neki od primjera su zaustavne rijeฤi, Gutenberg, framenet_v15, velike_gramatikei tako dalje.
Kako preuzeti sve pakete NLTK-a
Korak 1)Pokreni Python tumaฤ in Windows ili Linux
Korak 2)
- Unesite naredbe
import nltk nltk.download ()
- Otvara se prozor za preuzimanje NLTK-a. Kliknite gumb Preuzmi za preuzimanje skupa podataka. Ovaj ฤe postupak potrajati, ovisno o vaลกoj internetskoj vezi
NAPOMENA: Moลพete promijeniti lokaciju preuzimanja klikom na Datoteka> Promjena direktorija preuzimanja
Korak 3) Za testiranje instaliranih podataka koristite sljedeฤi kod
>>> from nltk.corpus import brown >>>brown.words()
['The', 'Fulton', 'County', 'Grand', 'Jury', 'said', โฆ]
Pokretanje NLP skripte
Razgovarat ฤemo o tome kako ฤe se NLP skripta izvrลกavati na naลกem lokalnom raฤunalu. Na trลพiลกtu postoje mnoge knjiลพnice za obradu prirodnog jezika. Dakle, odabir knjiลพnice ovisi o vaลกim zahtjevima. Ovdje je popis NLP knjiลพnice.
Kako pokrenuti NLTK skriptu
Korak 1) U svom omiljenom ureฤivaฤu koda kopirajte kod i spremite datoteku kao "NLTKsample.py "
from nltk.tokenize import RegexpTokenizer
tokenizer = RegexpTokenizer(r'\w+')
filterdText=tokenizer.tokenize('Hello Guru99, You have build a very good site and I love visiting your site.')
print(filterdText)
Objaลกnjenje koda:
- U ovom programu cilj je bio ukloniti sve vrste interpunkcijskih znakova iz zadanog teksta. Uvezli smo "RegexpTokenizer" koji je modul NLTK. Uklanja sve izraze, simbole, znakove, brojeve ili bilo ลกto ลกto god ลพelite.
- Upravo ste proslijedili regularni izraz u modul โRegexpTokenizerโ.
- Nadalje, tokenizirali smo rijeฤ pomoฤu modula "tokenize". Izlaz je pohranjen u varijabli "filterdText".
- I ispisao ih pomoฤu "print()."
Korak 2) U naredbenom retku
- Doฤite do mjesta gdje ste spremili datoteku
- Pokrenite naredbu Python NLTKsample.py
Ovo ฤe prikazati izlaz kao:
['Zdravo', 'Guru99', 'Vi', 'imate', 'gradite', 'a', 'vrlo', 'dobro', 'stranica', 'i', 'ja', 'ljubav', ' posjeฤivanje', 'vaลกa', 'stranica']


















