Kuidas NLTK-d alla laadida ja installida Windows/Mac

NLTK installimine sisse Windows

Selles osas saame teada, kuidas seadistada NLTK terminali kaudu (akendes kรคsuviip).

Allpool antud juhised pรตhinevad eeldusel, et teil pole Pythonit installitud. Niisiis, esimene samm on pythoni installimine.

paigaldamine Python in Windows

Step 1) Mine lingile https://www.python.org/downloads/, ja valige Windowsi jaoks uusim versioon.

paigaldamine Python in Windows

mรคrkused: kui te ei soovi uusimat versiooni alla laadida, kรผlastage allalaadimise vahekaarti ja vaadake kรตiki vรคljalaseid.

paigaldamine Python in Windows

Step 2) Klรตpsake allalaaditud failil

paigaldamine Python in Windows

Step 3)Valige Kohanda installimist

paigaldamine Python in Windows

Step 4) Klรตpsake nuppu Jร„RGMINE

paigaldamine Python in Windows

Step 5) Jรคrgmisel ekraanil

  1. Valige tรคpsemad valikud
  2. Mรครคrake kohandatud installikoht. Minu puhul valitakse tรถรถ hรตlbustamiseks C-draivi kaust
  3. Klรตpsake nuppu Installi

paigaldamine Python in Windows

Step 6) Kui installimine on lรตpetatud, klรตpsake nuppu Sule.

paigaldamine Python in Windows

Step 7) Kopeerige kausta Skriptid tee.

paigaldamine Python in Windows

Step 8) Windowsi kรคsureal

  • Liikuge pip-kausta asukohta
  • Sisestage NLTK installimiseks kรคsk
    pip3 install nltk
  • Paigaldamine peaks olema edukas

paigaldamine Python in Windows

Mร„RKUSED: Jaoks Python2 kasutage kรคsku commandpip2 install nltk

Step 9) In Windows Menรผรผ Start, otsige ja avage PythonShell

paigaldamine Python in Windows

Step 10) Alloleva kรคsu abil saate kontrollida, kas installimine on รตige

import nltk

paigaldamine Python in Windows

Kui te tรตrget ei nรคe, on installimine lรตppenud.

NLTK installimine Maci/Linuxisse

NLTK installimine Macis/Unixis nรตuab nltk installimiseks pythoni paketihaldurit pip. Kui pip pole installitud, jรคrgige protsessi lรตpuleviimiseks allolevaid juhiseid

Samm 1) Vรคrskendage paketiindeksit, tippides alloleva kรคsu

sudo apt update

Samm 2) Pipi paigaldamine jaoks Python 3:

sudo apt install python3-pip

Pipi saate installida ka kasutades easy_install.

sudo apt-get install python-setuptools  python-dev build-essential

Nรผรผd on easy_install installitud. Pip installimiseks kรคivitage allolev kรคsk

sudo easy_install pip

Samm 3)Kasutage NLTK installimiseks jรคrgmist kรคsku

sudo pip install -U nltk
sudo pip3 install -U nltk

NLTK installimine Anaconda kaudu

Samm 1) Palun installige anaconda (mida saab kasutada ka erinevate pakettide installimiseks) kรผlastades https://www.anaconda.com/products/individual ja valige, millise pythoni versiooni peate anaconda jaoks installima.

NLTK installimine Anaconda kaudu

Mรคrkus. รœksikasjalikud juhised leiate sellest รตpetusest paigalda anaconda

Step 2)Anaconda viibas

  1. Sisestage kรคsk
    conda install -c anaconda nltk
  2. Revlugege paketi versiooniuuendust, alandage versiooni, installige teave ja sisestage jah
  3. NLTK laaditakse alla ja installitakse

NLTK installimine Anaconda kaudu

NLTK andmestik

NLTK moodulil on saadaval palju andmekogumeid, mille peate kasutamiseks alla laadima. Tehnilisemalt nimetatakse seda korpus. Mรตned nรคited on stoppsรตnad, Gutenberg, framenet_v15, suured_grammatikadja nii edasi.

Kuidas alla laadida kรตiki NLTK pakette

Step 1)Kรคivita Python tรตlk in Windows vรตi Linux

Step 2)

  1. Sisestage kรคsud
import nltk
nltk.download ()
  1. Avaneb NLTK allalaaditud aken. Andmestiku allalaadimiseks klรตpsake allalaadimisnuppu. See protsess vรตtab teie Interneti-รผhenduse pรตhjal aega

Laadige alla kรตik NLTK paketid

Mร„RKUS: Allalaadimiskohta saate muuta, klรตpsates valikutel Fail > Muuda allalaadimiskataloogi

Laadige alla kรตik NLTK paketid

Step 3) Installitud andmete testimiseks kasutage jรคrgmist koodi

>>> from nltk.corpus import brown
>>>brown.words()

["The", "Fulton", "County", "Grand", "ลพรผrii", "รถeldi", ...]

Laadige alla kรตik NLTK paketid

NLP skripti kรคitamine

Arutame, kuidas NLP-skripti meie kohalikus arvutis kรคivitatakse. Turul on palju loomuliku keele tรถรถtlemise raamatukogusid. Seega sรตltub raamatukogu valimine teie vajadustest. Siin on nimekiri NLP raamatukogud.

NLTK skripti kรคivitamine

Samm 1) Kopeerige kood oma lemmikkoodiredaktoris ja salvestage fail nimega "NLTKsample.py "

from nltk.tokenize import RegexpTokenizer
tokenizer = RegexpTokenizer(r'\w+')
filterdText=tokenizer.tokenize('Hello Guru99, You have build a very good site and I love visiting your site.')
print(filterdText)

Kรคivitage NLTK skript

Koodi selgitus:

  1. Selle programmi eesmรคrk oli eemaldada etteantud tekstist igasugused kirjavahemรคrgid. Importisime "RegexpTokenizer", mis on moodul NLTK. See eemaldab kรตik vรคljendid, sรผmbolid, mรคrgid, numbrid vรตi kรตik asjad, mida iganes soovite.
  2. Olete just edastanud tavaavaldise moodulile โ€žRegexpTokenizerโ€.
  3. Lisaks muutsime sรตna tokenise mooduli abil. Vรคljund salvestatakse muutujas โ€œfilterdTextโ€.
  4. Ja printis need "print ()." abil.

Samm 2) Kรคsureal

  • Liikuge asukohta, kuhu olete faili salvestanud
  • Kรคivita kรคsk Python NLTKsample.py

Kรคivitage NLTK skript

See nรคitab vรคljundit jรคrgmiselt:

['Tere', 'Guru99', 'sina', 'oma', 'ehita', 'a', 'vรคga', 'hea', 'sait', 'ja', 'mina', 'armastan', ' kรผlastamine", "teie", "sait"]

Vรตta see postitus kokku jรคrgmiselt: