Kuidas NLTK-d alla laadida ja installida Windows/Mac
NLTK installimine sisse Windows
Selles osas saame teada, kuidas seadistada NLTK terminali kaudu (akendes kรคsuviip).
Allpool antud juhised pรตhinevad eeldusel, et teil pole Pythonit installitud. Niisiis, esimene samm on pythoni installimine.
paigaldamine Python in Windows
Step 1) Mine lingile https://www.python.org/downloads/, ja valige Windowsi jaoks uusim versioon.
mรคrkused: kui te ei soovi uusimat versiooni alla laadida, kรผlastage allalaadimise vahekaarti ja vaadake kรตiki vรคljalaseid.
Step 2) Klรตpsake allalaaditud failil
Step 3)Valige Kohanda installimist
Step 4) Klรตpsake nuppu JรRGMINE
Step 5) Jรคrgmisel ekraanil
- Valige tรคpsemad valikud
- Mรครคrake kohandatud installikoht. Minu puhul valitakse tรถรถ hรตlbustamiseks C-draivi kaust
- Klรตpsake nuppu Installi
Step 6) Kui installimine on lรตpetatud, klรตpsake nuppu Sule.
Step 7) Kopeerige kausta Skriptid tee.
Step 8) Windowsi kรคsureal
- Liikuge pip-kausta asukohta
- Sisestage NLTK installimiseks kรคsk
pip3 install nltk
- Paigaldamine peaks olema edukas
MรRKUSED: Jaoks Python2 kasutage kรคsku commandpip2 install nltk
Step 9) In Windows Menรผรผ Start, otsige ja avage PythonShell
Step 10) Alloleva kรคsu abil saate kontrollida, kas installimine on รตige
import nltk
Kui te tรตrget ei nรคe, on installimine lรตppenud.
NLTK installimine Maci/Linuxisse
NLTK installimine Macis/Unixis nรตuab nltk installimiseks pythoni paketihaldurit pip. Kui pip pole installitud, jรคrgige protsessi lรตpuleviimiseks allolevaid juhiseid
Samm 1) Vรคrskendage paketiindeksit, tippides alloleva kรคsu
sudo apt update
Samm 2) Pipi paigaldamine jaoks Python 3:
sudo apt install python3-pip
Pipi saate installida ka kasutades easy_install.
sudo apt-get install python-setuptools python-dev build-essential
Nรผรผd on easy_install installitud. Pip installimiseks kรคivitage allolev kรคsk
sudo easy_install pip
Samm 3)Kasutage NLTK installimiseks jรคrgmist kรคsku
sudo pip install -U nltk sudo pip3 install -U nltk
NLTK installimine Anaconda kaudu
Samm 1) Palun installige anaconda (mida saab kasutada ka erinevate pakettide installimiseks) kรผlastades https://www.anaconda.com/products/individual ja valige, millise pythoni versiooni peate anaconda jaoks installima.
Mรคrkus. รksikasjalikud juhised leiate sellest รตpetusest paigalda anaconda
Step 2)Anaconda viibas
- Sisestage kรคsk
conda install -c anaconda nltk
- Revlugege paketi versiooniuuendust, alandage versiooni, installige teave ja sisestage jah
- NLTK laaditakse alla ja installitakse
NLTK andmestik
NLTK moodulil on saadaval palju andmekogumeid, mille peate kasutamiseks alla laadima. Tehnilisemalt nimetatakse seda korpus. Mรตned nรคited on stoppsรตnad, Gutenberg, framenet_v15, suured_grammatikadja nii edasi.
Kuidas alla laadida kรตiki NLTK pakette
Step 1)Kรคivita Python tรตlk in Windows vรตi Linux
Step 2)
- Sisestage kรคsud
import nltk nltk.download ()
- Avaneb NLTK allalaaditud aken. Andmestiku allalaadimiseks klรตpsake allalaadimisnuppu. See protsess vรตtab teie Interneti-รผhenduse pรตhjal aega
MรRKUS: Allalaadimiskohta saate muuta, klรตpsates valikutel Fail > Muuda allalaadimiskataloogi
Step 3) Installitud andmete testimiseks kasutage jรคrgmist koodi
>>> from nltk.corpus import brown >>>brown.words()
["The", "Fulton", "County", "Grand", "ลพรผrii", "รถeldi", ...]
NLP skripti kรคitamine
Arutame, kuidas NLP-skripti meie kohalikus arvutis kรคivitatakse. Turul on palju loomuliku keele tรถรถtlemise raamatukogusid. Seega sรตltub raamatukogu valimine teie vajadustest. Siin on nimekiri NLP raamatukogud.
NLTK skripti kรคivitamine
Samm 1) Kopeerige kood oma lemmikkoodiredaktoris ja salvestage fail nimega "NLTKsample.py "
from nltk.tokenize import RegexpTokenizer
tokenizer = RegexpTokenizer(r'\w+')
filterdText=tokenizer.tokenize('Hello Guru99, You have build a very good site and I love visiting your site.')
print(filterdText)
Koodi selgitus:
- Selle programmi eesmรคrk oli eemaldada etteantud tekstist igasugused kirjavahemรคrgid. Importisime "RegexpTokenizer", mis on moodul NLTK. See eemaldab kรตik vรคljendid, sรผmbolid, mรคrgid, numbrid vรตi kรตik asjad, mida iganes soovite.
- Olete just edastanud tavaavaldise moodulile โRegexpTokenizerโ.
- Lisaks muutsime sรตna tokenise mooduli abil. Vรคljund salvestatakse muutujas โfilterdTextโ.
- Ja printis need "print ()." abil.
Samm 2) Kรคsureal
- Liikuge asukohta, kuhu olete faili salvestanud
- Kรคivita kรคsk Python NLTKsample.py
See nรคitab vรคljundit jรคrgmiselt:
['Tere', 'Guru99', 'sina', 'oma', 'ehita', 'a', 'vรคga', 'hea', 'sait', 'ja', 'mina', 'armastan', ' kรผlastamine", "teie", "sait"]


















