| maison  | Hardware  | réseaux  | programmation  | Logiciel  | Dépannage  | systèmes |  
Logiciel  
  • Adobe Illustrator

  • Un logiciel d'animation

  • antivirus Software

  • Logiciel audio

  • Sauvegarder des données

  • Gravez des CD

  • Gravez des DVD

  • Compression de données

  • Logiciel de base de données

  • desktop Publishing

  • desktop Video

  • Digital Video Software

  • Drupal

  • Logiciels éducatifs

  • Software Engineering

  • Types de fichier d'extension

  • Financial Software

  • Freeware , Shareware et Abandonware

  • GIMP

  • Graphics Software

  • Accueil Recording Software

  • Microsoft Access

  • Microsoft Excel

  • Microsoft Publisher

  • Microsoft Word

  • Code Open Source

  • Autres logiciels informatiques

  • Jeux PC

  • Photoshop

  • Portable Document Format

  • PowerPoint

  • Logiciel de présentation

  • Logiciels de productivité

  • Quicktime

  • Gestion Remote Desktop

  • SQL Server

  • Skype

  • Logiciel bêta de presse

  • Consultants logiciels

  • Les sociétés de développement de logiciels

  • Licences de logiciels

  • Tableur

  • Logiciel de préparation d' impôt

  • Logiciel utilitaire

  • Clip Art Web

  • Windows Media Player

  • Logiciel de traitement de texte
  •  
    Connaissances Informatiques >> Logiciel >> Portable Document Format >> Content
    Comment Index et Recherche un PDF en Java avec Lucene
    Apache Lucene est un texte bibliothèque de moteur de recherche complet, écrit en Java. Vous pouvez utiliser Lucene pour indexer et rechercher tout type de document texte. Pour convertir un fichier Portable Document Format (PDF ) dans un format de texte qui peut Lucene index, vous pouvez utiliser la classe open source PDFBox qui possède des méthodes spécifiquement pour Lucene. Il suffit de fournir le nom du fichier PDF à PDFBox et obtenir un objet Document Lucene qui peut être ajouté à l'indice et fouillé comme n'importe quel fichier texte. Instructions
    1

    Sélectionnez un analyseur Lucene à utiliser dans la création de l' index, par exemple " StandardAnalyzer . " Créer un objet " IndexWriter " pour gérer l'ajout de nouveaux éléments à l'index, par exemple :

    IndexWriter myWriter = new IndexWriter ( "index" , nouveau StandardAnalyzer () , true);
    2 < p> Appel " LucenePDFDocument " pour obtenir un objet Document Lucene de votre fichier PDF . Ajouter d'autres domaines clés de l'objet et ajouter l'objet à l'index Lucene. Par exemple:

    document PDFDoc = LucenePDFDocument.getDoument (filename) ;

    pdfDoc.add ( nouveau champ ( "title" , pdf.getTitle (), Field.Store.YES , Field. Index.TOKENIZED ) ) ;

    pdfDoc.add ( nouveau champ ( " auteur " , pdf.getAuthor (), Field.Store.YES , Field.Index.TOKENIZED ) ) ;

    myWriter . addDocument ( pDFDoc ) ;
    3

    Utilisez la classe " SearchEngine " pour rechercher l'index Lucene. " SearchEngine " retourne un objet " Hits " Lucene avec une liste d' objets " hit" . Par exemple:

    SearchEngine MySearch = new SearchEngine ();

    Visites myHits = mySearch.performSearch ( searchText ) ;

    System.out.println (" Documents présents: " + myHits.length ());
    4

    parcourir les objets " hit" pour obtenir plus d'informations sur chaque match. Les objets " de vie " sont classés par pertinence à la recherche , et vous pouvez également obtenir la note de recherche relatif à " getScore (). " Par exemple:

    Iterator ITR = myHits.iterator ();

    while ( itr.hasNext ()) {

    Hit theHit = itr.next () ;

    document thedoc = theHit.getDocument ();

    System.out.println ( theDoc.get ( "title" ) + "-" + theHit.getScore ()); < br >

    }

    Previous :

    next :
      articles connexes
    ·Comment exporter au format PDF PaperPort 
    ·Comment aiguiser un PDF 
    ·Comment mettre en évidence un document PDF avec Adobe …
    ·Comment convertir des pages web en documents PDF 
    ·Comment enregistrer une image au format PDF dans Window…
    ·Comment faire un PDF multipage Sur un JPG 
    ·Comment annoter un fichier PDF 
    ·Comment faire un PDF non modifiable 
    ·Comment puis-je convertir un fichier PDF au format Powe…
    ·Comment combiner des fichiers PDF en un seul fichier PD…
      articles en vedette
    ·Comment graver un DVD avec un menu 
    ·Comment réinstaller McAfee Avec un abonnement expiré 
    ·VBA: Comment déterminer la taille de la matrice 
    ·Quelle est l'extension du fichier Ltr 
    ·Comment se débarrasser de l'arrière-plan dans Illustr…
    ·Comment puis- je connecter Spyware Doctor quand il mont…
    ·Comment faire de plusieurs tracés dans Excel 
    ·Comment utiliser le Virus Remover VCleaner 
    ·Comment se débarrasser d'un XLS fichier corrompu 
    ·Comment créer HTML Email dans Groupwise 
    Copyright © Connaissances Informatiques http://fr.wingwit.com