18 Σεπτεμβρίου 2020

Ο αλγόριθμος που «διαβάζει» το Διαδίκτυο

Γράφει ο Γιάννης Παλιούρης

Το γλωσσικό μοντέλο Τεχνητής Νοημοσύνης GPT-3, άφησε ενεούς τους επιστήμονες όταν κατόρθωσε να συντάξει ολόκληρες παραγράφους, που να βγάζουν νόημα, χωρίς την ελάχιστη ανθρώπινη παρέμβαση. Και όχι μόνο, αφού το GPT-3 συμπλήρωνε αυτόματα υπολογιστικά φύλλα, ακόμα και γραμμές κώδικα. Ωστόσο, τα λάθη δεν έλειψαν, απόδειξη ότι ακόμα και η πιο προηγμένη μορφή Τεχνητής Νοημοσύνης υπολείπεται της επιδεξιότητας των ανθρώπινων νευρώνων, ένα δώρο της πολυετούς εξέλιξης του είδους μας.

Αν και τα γλωσσικά μοντέλα Τεχνητής Νοημοσύνης έχουν κάνει πραγματικά άλματα, παραμένουν απλώς εξαιρετικές μηχανές ανάγνωσης και μίμησης, με περιορισμένες, όμως, δυνατότητες κριτικής σκέψης. Αυτό είναι ένα σημαντικό πρόβλημα, εάν θέλουμε να έχουμε στην υπηρεσία μας μια αξιόπιστη μορφή Τεχνητής Νοημοσύνης. Και αυτό θέλει να δημιουργήσει η Diffbot, χάρη σε ένα λογισμικό που θα σαρώσει το περιεχόμενο του συνόλου του ίντερνετ, προκειμένου να γίνει τόσο «έξυπνο» όσο εμείς.

Γραφήματα γνώσης

Η Τεχνητή Νοημοσύνη της Diffbot θα διαβάσει κάθε σελίδα σε ολόκληρο τον δημόσιο ιστό, σε πολλές γλώσσες, και θα εξαγάγει όσα λογικά γεγονότα από αυτές τις σελίδες μπορεί. Οπως και το GPT-3, το σύστημα της Diffbot «μαθαίνει» με αυτή τη μέθοδο. Αλλά αντί να χρησιμοποιήσει αυτά τα δεδομένα για να εκπαιδεύσει ένα γλωσσικό μοντέλο, θα μετατρέπει αυτό που διαβάζει σε μια σειρά λογικών συνειρμών: Ο Ισαάκ Νεύτων διατύπωσε τους τρεις μνημειώδεις νόμους της κίνησης και τον νόμο της βαρύτητας. Σε αυτούς τους νόμους στηρίχθηκε η κλασική φυσική. Αρα, ο Ισαάκ Νεύτων είναι ο θεμελιωτής της κλασικής φυσικής.

Το συμπέρασμα αυτό μπορεί να προκύπτει αβίαστα ακόμα και για έναν μαθητή του Γυμνασίου, αλλά για έναν αλγόριθμο αποτελεί άλυτη σπαζοκεφαλιά. Και αυτό γιατί βρίσκεται ενώπιον μιας σύνθετης νοηματικής δομής, γνωστής ως γράφημα γνώσης. Τα γραφήματα γνώσης -«Knowledge Graphs»- δεν είναι νέα κατάκτηση. Αντίθετα, τα χρησιμοποιούν εδώ και χρόνια οι μηχανές αναζήτησης, ώστε οι αλγόριθμοι που τις τροφοδοτούν να απαντούν στα ποικίλα ερωτήματα των χρηστών με τέτοιο τρόπο που δείχνει ότι καταλαβαίνουν καλύτερα τι τους ζητείται. Ωστόσο τα γραφήματα γνώσης σχεδιάζονται «στο χέρι» από ανθρώπους. Με άλλα λόγια, η δύναμη των αλγορίθμων εξαρτάται από το πόσο καλός είναι ο προγραμματιστής που τους «γράφει».

Η Diffbot θέλει να το αλλάξει αυτό, αυτοματοποιώντας πλήρως τη διαδικασία κατασκευής γραφημάτων γνώσεως, δημιουργώντας το μεγαλύτερο γράφημα γνώσεων που δημιουργήθηκε ποτέ. Για να συλλέξει τα απαραίτητα δεδομένα, η Τεχνητή Νοημοσύνη της Diffbot «διαβάζει» τον ιστό όπως θα έκανε ένας άνθρωπος, αλλά προφανώς πολύ πιο γρήγορα.

Αρχικά σκανάρει κάθε ιστοσελίδα ως εικόνα, ακατέργαστα pixels, και χρησιμοποιεί αλγόριθμους αναγνώρισης εικόνας για να κατηγοριοποιήσει τη σελίδα ως έναν από είκοσι διαφορετικούς τύπους ανάρτησης: βίντεο, εικόνα, άρθρο, συμβάν, νήμα συζήτησης. Στη συνέχεια, εντοπίζει βασικά στοιχεία, όπως τίτλο, συγγραφέα, περιγραφή προϊόντος ή τιμή και χρησιμοποιεί τεχνικές NLP (Nευρο-Γλωσσικoύ Προγραμματισμού) για εξαγωγή «γεγονότων» από οποιοδήποτε κείμενο.

Η Diffbot εξάγει γεγονότα από σελίδες γραμμένες σε οποιαδήποτε γλώσσα, πράγμα που σημαίνει ότι μπορεί να απαντήσει σε ερωτήσεις σχετικά με τον Ισαάκ Νεύτωνα, χρησιμοποιώντας γεγονότα που λαμβάνονται από άρθρα σε κινεζικά ή αραβικά, ακόμη και αν δεν περιέχουν τον όρο Ισαάκ Νεύτων στα ελληνικά.

Η περιήγηση στον ιστό σαν άνθρωπος επιτρέπει στη Diffbot να «βλέπει» τα γεγονότα όπως εμείς. Σημαίνει επίσης ότι πλοηγείται στον ιστό όπως εμείς. Μόνο που γνωρίζει τον ιστό με τρόπο που εμείς ποτέ δεν θα μπορέσουμε. Και κάπου εδώ ξεκινούν τα ερωτήματα.

Ποιος «χαίρεται» τη γνώση;

Η Diffbot ανιχνεύει τον ιστό ασταμάτητα και αναδημιουργεί νέα γραφήματα γνώσεων κάθε τέσσερις έως πέντε ημέρες. Ως αποτέλεσμα ο αλγόριθμος της εταιρείας προσθέτει 100 έως 150 εκατομμύρια «οντότητες» γνώσεων κάθε μήνα, καθώς εμφανίζονται νέοι άνθρωποι στο διαδίκτυο, δημιουργούνται εταιρείες, κυκλοφορούν προϊόντα και αναρτώνται ατελείωτες δημοσιεύσεις. Και όλα αυτά απολύτως νόμιμα, αφού το διαδίκτυο είναι ανοιχτό για όλους, ακόμα και για αλγόριθμους - ή μάλλον περισσότερο γι' αυτούς. Αλλωστε, δεν θα ήταν παράνομο για έναν άνθρωπο να διαβάσει και να απομνημονεύσει κάθε πληροφορία που έχει δημοσιευτεί ποτέ, αν φυσικά μπορούσε. 

Γιατί, λοιπόν, να μην το κάνει αυτό και μια μηχανή; Το αποτέλεσμα, πάντως, είναι ότι η Diffbot προσθέτει συνεχώς νέο υλικό στα κέντρα δεδομένων της καθώς αυξάνονται τα γραφήματα γνώσεων που δημιουργεί ο αλγόριθμός της. Προς το παρόν, επιστήμονες και ερευνητές έχουν δωρεάν πρόσβαση στο γράφημα γνώσεων της εταιρείας. Αλλά η Diffbot έχει επίσης περίπου 400 πελάτες που πληρώνουν. Η μηχανή αναζήτησης DuckDuckGo τη χρησιμοποιεί για να ενισχύσει την ακρίβεια των αποτελεσμάτων που δίνει στους χρήστες. Το Snapchat για να εξάγει στιγμιότυπα από σελίδες ειδήσεων. Και κάποιες ιστοσελίδες χρηματοοικονομικών ερευνών για πληροφορίες σχετικά με το χρηματιστήριο.

*Αναδημοσίευση από τον Φιλελεύθερο που κυκλοφόρησε το Σαββατοκύριακο 12-13 Σεπτεμβρίου 

liberal.gr
ΕΛΕΥΘΕΡΟΙ ΕΛΛΗΝΕΣ 



Share

Δεν υπάρχουν σχόλια:

Λίγες οδηγίες πριν επισκεφθείτε το ιστολόγιό μας (Για νέους επισκέπτες)

1. Στην στήλη αριστερά βλέπετε τις αναρτήσεις του ιστολογίου μας τις οποίες μπορείτε ελεύθερα να σχολιάσετε επωνύμως, ανωνύμως ή με ψευδώνυμο, πατώντας απλά την λέξη κάτω από την ανάρτηση που γραφει "σχόλια" ή "δημοσίευση σχολίου" (σας προτείνω να διαβάσετε με προσοχή τις οδηγίες που θα βρείτε πάνω από την φόρμα που θα ανοίξει ώστε να γραψετε το σχόλιό σας). Επίσης μπορείτε να στείλετε σε φίλους σας την συγκεκριμένη ανάρτηση που θέλετε απλά πατώντας τον φάκελλο που βλέπετε στο κάτω μέρος της ανάρτησης. Θα ανοίξει μια φόρμα στην οποία μπορείτε να γράψετε το email του φίλου σας, ενώ αν έχετε προφίλ στο Facebook ή στο Twitter μπορείτε με τα εικονίδια που θα βρείτε στο τέλος της ανάρτησης να την μοιραστείτε με τους φίλους σας.

2. Στην δεξιά στήλη του ιστολογίου μας μπορείτε να βρείτε το πλαίσιο στο οποίο βάζοντας το email σας και πατώντας την λέξη Submit θα ενημερώνεστε αυτόματα για τις τελευταίες αναρτήσεις του ιστολογίου μας.

3. Αν έχετε λογαριασμό στο Twitter σας δινεται η δυνατότητα να μας κάνετε follow και να παρακολουθείτε το ιστολόγιό μας από εκεί. Θα βρείτε το σχετικό εικονίδιο του Twitter κάτω από τα πλαίσια του Google Friend Connect, στην δεξιά στήλη του ιστολογίου μας.

4. Μπορείτε να ενημερωθείτε από την δεξιά στήλη του ιστολογίου μας με τα διάφορα gadgets για τον καιρό, να δείτε ανακοινώσεις, στατιστικά, ειδήσεις και λόγια ή κείμενα που δείχνουν τις αρχές και τα πιστεύω του ιστολογίου μας. Επίσης μπορείτε να κάνετε αναζήτηση βάζοντας μια λέξη στο πλαίσιο της Αναζήτησης (κάτω από τους αναγνώστες μας). Πατώντας την λέξη Αναζήτηση θα εμφανιστούν σχετικές αναρτήσεις μας πάνω από τον χώρο των αναρτήσεων. Παράλληλα μπορείτε να δείτε τις αναρτήσεις του τρέχοντος μήνα αλλά και να επιλέξετε κάποια συγκεκριμένη κατηγορία αναρτήσεων από την σχετική στήλη δεξιά.

5. Μπορείτε ακόμα να αφήσετε το μήνυμά σας στο μικρό τσατάκι του blog μας στην δεξιά στήλη γράφοντας απλά το όνομά σας ή κάποιο ψευδώνυμο στην θέση "όνομα" (name) και το μήνυμά σας στην θέση "Μήνυμα" (Message).

6. Επίσης μπορείτε να μας στείλετε ηλεκτρονικό μήνυμα στην διεύθυνσή μας koukthanos@gmail.com με όποιο περιεχόμενο επιθυμείτε. Αν είναι σε προσωπικό επίπεδο θα λάβετε πολύ σύντομα απάντησή μας.

7. Τέλος μπορείτε να βρείτε στην δεξιά στήλη του ιστολογίου μας τα φιλικά μας ιστολόγια, τα ιστολόγια που παρακολουθούμε αλλά και πολλούς ενδιαφέροντες συνδέσμους.

Να σας υπενθυμίσουμε ότι παρακάτω μπορείτε να βρείτε χρήσιμες οδηγίες για την κατασκευή των αναρτήσεών μας αλλά και στην κάτω μπάρα του ιστολογίου μας ότι έχει σχέση με δημοσιεύσεις και πνευματικά δικαιώματα.

ΣΑΣ ΕΥΧΟΜΑΣΤΕ ΚΑΛΗ ΠΕΡΙΗΓΗΣΗ

Χρήσιμες οδηγίες για τις αναρτήσεις μας.

1. Στις αναρτήσεις μας μπαίνει ΠΑΝΤΑ η πηγή σε οποιαδήποτε ανάρτηση ή μερος αναρτησης που προέρχεται απο άλλο ιστολόγιο. Αν δεν προέρχεται από κάποιο άλλο ιστολόγιο και προέρχεται από φίλο αναγνώστη ή επώνυμο ή άνωνυμο συγγραφέα, υπάρχει ΠΑΝΤΑ σε εμφανες σημείο το ονομά του ή αναφέρεται ότι προέρχεται από ανώνυμο αναγνώστη μας.

2. Για όλες τις υπόλοιπες αναρτήσεις που δεν έχουν υπογραφή ΙΣΧΥΕΙ η αυτόματη υπογραφή της ανάρτησης. Ετσι όταν δεν βλέπετε καμιά πηγή ή αναφορά σε ανωνυμο ή επώνυμο συντάκτη να θεωρείτε ΩΣ ΑΥΣΤΗΡΟ ΚΑΝΟΝΑ ότι ισχύει η αυτόματη υπογραφή του αναρτήσαντα.

3. Οταν βλέπετε ανάρτηση με πηγή ή και επώνυμο ή ανώνυμο συντάκτη αλλά στη συνέχεια υπάρχει και ΣΧΟΛΙΟ, τότε αυτό είναι ΚΑΙ ΠΑΛΙ του αναρτήσαντα δηλαδή είναι σχόλιο που προέρχεται από το ιστολόγιό μας.

Σημείωση: Να σημειώσουμε ότι εκτός των αναρτήσεων που υπογράφει ο διαχειριστής μας, όλες οι άλλες απόψεις που αναφέρονται σε αυτές ανήκουν αποκλειστικά στους συντάκτες των άρθρων. Τέλος άλλες πληροφορίες για δημοσιεύσεις και πνευματικά δικαιώματα μπορείτε να βρείτε στην κάτω μπάρα του ιστολογίου μας.