Détection noms dans les appels Python pour les compétences d'un programmeur et un linguiste . La langue anglaise elle-même pose des pièges pour le linguiste calcul intrépide avec sa riche ambiguïté morphologique. Par exemple, le mot " croix " pourrait être un nom pluriel ou un verbe au présent à la troisième personne . Heureusement, les créateurs du langage naturel Toolkit Python Module ont développé un tagger partie du discours qui explique ces difficultés et peuvent étiqueter les mots de phrases en anglais avec leurs parties respectives de la parole , y compris les noms. Choses que vous devez
Python 2.4, 2.5, ou 2.6
Natural Language Toolkit Python Module
Voir Plus Instructions
1
télécharger et installer le module Python langage naturel Boîte à outils sur le site du projet de ntlk.org . Vous pouvez avoir besoin d'installer des modules supplémentaires pour soutenir NLTK .
2
Ouvrez une fenêtre de terminal et de commencer une session Python Python en tapant à l'invite de ligne de commande . Quand Python est en marche , appeler le module NLTK avec la commande NLTK d'importation. Les invites et les commandes ressemblent à ceci sur Mac OS X:
My- MacBook -Pro : ~ $ python PNA1
Python 2.6.1 ( R261 : 67515 24 juin 2010 , 21:47 : 49)
[ GCC 4.2.1 ( Apple Inc. build 5646 ) ] sur darwin
Tapez " help" , "copyright" , "crédits" ou " licence " pour plus d'informations . Photos
>>> import NLTK
>>>
3
Invoke de la part de tagger de la parole et entrez la phrase qui vous voulez détecter les noms en tapant les commandes et les données suivantes à l' invite de Python :
>>> text = nltk.word_tokenize ( " l'homme traverse la rue pour vendre croix. " ) < br >
>>> nltk.pos_tag (texte)
4
Appuyez sur la touche de retour après >>> nltk.pos_tag (texte)
[ ,"(' le ', ' DT '), ( 'man ', ' NN' ) , (' croix ', ' VBZ ') , (' la ', ' DT '), ( 'street ', ' NN' ) , ( 'à' , 'To') , ( 'vendre' , 'VB ') , (' croix ', ' NNS ') , ('.' , '.') ]
>> > Photos
NLTK a correctement étiqueté chaque mot de la phrase. En particulier, il a détecté les noms et les étiqueté comme noms singuliers avec NN ( homme de la rue) et le pluriel des noms avec NNS (croix) et a bien marqué la première apparition de croix comme un verbe avec le tag VBZ .