Comment construire un index inversé avec MapReduce
MapReduce est un modèle de programmation parallèle développé dans Google pour les ensembles de données volumineux. Il traite les données en morceaux plutôt que dans l'ordre. Pour ce faire , il s'appuie sur une cartographie des fonctions d'entrée appariés ( touches) et les valeurs qu'il met ensuite à travers la fonction reduce - donc , son nom - pour rendre les données pour comprendre . Au lieu de fournir la fonction de carte avec une clé et une valeur , un index inversé paires mots et les documents de texte de recherche. Vous pouvez utiliser des index inversés dans MapReduce pour créer un index pour une recherche par mot clé , par exemple. Instructions 1
Tapez le code suivant pour la fonction de carte :
publique InvertedIndexerMapper de classe statique s'étend MapReduceBaseimplements Mapper { mot du texte statique finale privée = new text () ; emplacement du texte statique finale privée = new Text ();
plan public void (touche LongWritable , texte val, OutputCollector , journaliste de Reporter ) throws IOException { FileSplit FileSplit = ( FileSplit ) reporter.getInputSplit (); string filename = fileSplit.getPath () getName (); location.set ( fileName ) ; ligne Chaîne de