Pierre Senellart

Ara (SYSTRAN) Deu (SYSTRAN) Ell (SYSTRAN) Eng Fra (SYSTRAN) Ita (SYSTRAN) Jpn (SYSTRAN) Kor (SYSTRAN) Nld (SYSTRAN) Por (SYSTRAN) Rus (SYSTRAN) Spa (SYSTRAN) Swe (SYSTRAN) Zho (SYSTRAN)

"Οικία" > Λογισμικό > Wikipedia

  • "Οικία"
  • Ειδήσεις
  • Περίληψη
  • Δημοσιεύσεις
  • Συζητήσεις
  • Να διδάξει
  • Σπουδαστές
  • Λογισμικό
    • Fuzzy XML
    • Larse Sparse Graph
    • Wikipedia
  • Άλλες εργασίες
Επαφή: pierre@senellart.com
  • Εισαγωγή
  • Εξαγωγή γραφικών παραστάσεων
  • Εξαγωγή Snaphsot

Τελευταία τροποποίηση
2011-03-07 21:18:14 UTC

Αυτή η σελίδα έχει μεταφραστεί από τα συστήματα αυτόματης μετάφρασης του SYSTRAN. Η αυτόματη μετάφραση δεν είναι ακόμα μια τέλεια τεχνολογία, παρακαλώ συγχωρήστε τα πιθανά σφάλματα που περιλαμβάνονται στη σελίδα. Μπορείτε να βρείτε μια αρχική έκδοση του κειμένου στην ακόλουθη γλώσσα:

  • Αγγλικά

Το Wikipedia αφορούσε την ουσία

Εισαγωγή

Αυτό το webpage περιέχει μια συλλογή των αρχείων εντολών κάποιας χρησιμότητας για την εξαγωγή του περιεχομένου από Wikipedia και άλλα wikis Wikimedia.

Εξαγωγή γραφικών παραστάσεων

Το ακόλουθα C++ πρόγραμμα και τα αρχεία εντολών Perl μπορούν να χρησιμοποιηθούν για να εξαγάγουν τη γραφική παράσταση Wikipedia από μια απόρριψη XML της βάσης δεδομένων (τέτοιες απορρίψεις μπορούν να μεταφορτωθούν από τους κεντρικούς υπολογιστές Wikipedia εδώ):

  • wikipedia_graph.cpp, C++ πρόγραμμα, που χρησιμοποιούν libxml2 του στοιχειού, libunicode και μερικά χαρακτηριστικά γνωρίσματα από τη C++ TR1 βιβλιοθήκη (οι πρόσφατοι μεταγλωττιστές πρέπει να τους υποστηρίξουν natively).
  • ordonne.pl, αρχείο εντολών Perl, το οποίο χρησιμοποιεί το εξωτερικό πρόγραμμαsort Unix.
  • merge.pl, αρχείο εντολών Perl, το οποίο χρησιμοποιεί το εξωτερικό πρόγραμμαsort Unix.

Χρήση:

mkdir temp
cd temp
$PROG/wikipedia_graph $SRC/wiki.xml.gz
$PROG/ordonne.pl
$PROG/merge.pl > ../edge_list
cd ..
    

Αυτό θα παραγάγει έναedge_list αρχείο, που περιέχει τον κατάλογο των ακρών γραφικών παραστάσεων, μαζί με έναindex αρχείο, που περιέχει τις ετικέτες κόμβων. Η μορφή αυτού του αρχείου είναι αυτή που χρησιμοποιείται από τη μεγάλη αραιή βιβλιοθήκη γραφικών παραστάσεων.

Εξαγωγή Snaphsot

split_xml.pl είναι ένα αρχείο εντολών Perl που εξάγει τα στιγμιότυπα από μια απόρριψη Wikipedia που περιέχει τις πολλαπλάσιες αναθεωρήσεις.