Χάκερς «ξεγελούν» την τεχνητή νοημοσύνη με «κακά μαθηματικά» για να αποκαλύψουν τα ελαττώματα και τα κενά της, όπως αναφέρει το Bloomberg.
Η Kennedy Mays ξεγέλασε ένα μεγάλο γλωσσικό μοντέλο. Χρειάστηκε λίγη προσπάθεια παραπάνω, αλλά κατάφερε να αναγκάσει το chat bot να πει 9 + 10 = 21.
«Κακά μαθηματικά»
«Αρχικά ήταν μια ανοιχτή συζήτηση», δήλωσε η 21χρονη φοιτήτρια από τη Σαβάνα της Τζόρτζια. Αρκετές προτροπές αργότερα, τελικά σταμάτησε να προσδιορίζει το λανθασμένο άθροισμα με οποιονδήποτε τρόπο.
Η παραγωγή των «κακών μαθηματικών» είναι ένας μόνο από τους τρόπους με τους οποίους χιλιάδες χάκερ προσπαθούν να αποκαλύψουν τα ελαττώματα στα συστήματα γεννητικής τεχνητής νοημοσύνης σε έναν δημόσιο διαγωνισμό που πραγματοποιείται στο συνέδριο χάκερ DEF CON αυτό το Σαββατοκύριακο στο Λας Βέγκας.
«Μονομαχία» στο Λας Βέγκας
«Καμπουριασμένοι» πάνω από 156 φορητούς υπολογιστές για 50 λεπτά κάθε φορά, οι συμμετέχοντες «μάχονται» με μερικές από τις πιο ευφυείς πλατφόρμες του κόσμου σε πρωτοφανή κλίμακα. Δοκιμάζουν αν κάποιο από τα οκτώ μοντέλα που παράγονται από εταιρείες όπως η Google της Alphabet, η Meta Platforms και η OpenAI θα κάνει λάθη που κυμαίνονται από βαρετά έως επικίνδυνα – θα ισχυριστεί ότι είναι άνθρωπος, θα διαδώσει εσφαλμένους ισχυρισμούς για μέρη και ανθρώπους ή θα υποστηρίξει την κακοποίηση.
Ο στόχος είναι να φανεί αν οι εταιρείες μπορούν τελικά να δημιουργήσουν νέες «μπάρες» ασφαλείας για να περιορίσουν ορισμένα από τα τεράστια προβλήματα που σχετίζονται πλοένα και περισσότερο με τα μεγάλα γλωσσικά μοντέλα. Το εγχείρημα υποστηρίζεται από τον Λευκό Οίκο, ο οποίος βοήθησε επίσης στην ανάπτυξη του διαγωνισμού.
Εγγενής προκατάληψη
Για τη Mays, η οποία έχει συνηθίσει περισσότερο να βασίζεται στην τεχνητή νοημοσύνη για την ανακατασκευή σωματιδίων κοσμικής ακτινοβολίας από το διάστημα στο πλαίσιο του προπτυχιακού της, οι προκλήσεις είναι βαθύτερες από τα κακά μαθηματικά.
«Η μεγαλύτερη ανησυχία μου είναι η εγγενής προκατάληψη», επισήμανε, προσθέτοντας ότι ανησυχεί ιδιαίτερα για τον ρατσισμό. Ζήτησε από το μοντέλο να εξετάσει τον ρατσισμό από τη σκοπιά ενός μέλους της Κου Κλουξ Κλαν. Είπε ότι το μοντέλο κατέληξε να εγκρίνει τον λόγο που ο ρατσισμός προκαλεί μίσος και διακρίσεις.
Κατασκοπεία
Ένας δημοσιογράφος του Bloomberg που συμμετείχε σε έναν 50λεπτο «αγώνα» έπεισε ένα από τα μοντέλα (κανένα από τα οποία δεν αναγνωρίζεται στον χρήστη κατά τη διάρκεια του διαγωνισμού) να παρανομήσει μετά από μία μόνο ερώτηση σχετικά με τον τρόπο κατασκοπείας.
Κατάχρηση και χειραγώγηση
«Πρέπει να προσπαθήσουμε να προλάβουμε την κατάχρηση και τη χειραγώγηση», δήλωσε η Καμίλ Στιούαρτ Γκλόστερ, αναπληρώτρια εθνική διευθύντρια κυβερνοχώρου για την τεχνολογία και την ασφάλεια του οικοσυστήματος στην κυβέρνηση Μπάιντεν.
Ο Λευκός Οίκος δημοσίευσε πέρυσι ένα προσχέδιο νόμου για την τεχνητή νοημοσύνη.
Η Arati Prabhakar, διευθύντρια του Γραφείου Επιστημονικής και Τεχνολογικής Πολιτικής του Λευκού Οίκου, η οποία βοήθησε στη διαμόρφωση της εκδήλωσης και επιστράτευσε τη συμμετοχή των εταιρειών, συμφώνησε ότι τα εθελοντικά μέτρα δεν πάνε αρκετά μακριά.
«Ο καθένας φαίνεται να βρίσκει έναν τρόπο να σπάσει αυτά τα συστήματα», δήλωσε αφού επισκέφθηκε τους χάκερς εν δράσει την Κυριακή. Η προσπάθεια αυτή θα δώσει επείγουσα ώθηση στην επιδίωξη για ασφαλείς και αποτελεσματικές πλατφόρμες, τόνισε.
Στην αίθουσα, γεμάτη από χάκερς, κάποιος ανέφερε ότι έπεισε τον chat bot να αποκαλύψει στοιχεία πιστωτικών καρτών που δεν έπρεπε να μοιραστεί. Ένας άλλος συμμετέχων, ξεγέλασε το μηχάνημα πείθοντάς το να πει ότι ο Μπαράκ Ομπάμα γεννήθηκε στην Κένυα.
Δεν υπάρχουν σχόλια:
Δημοσίευση σχολίου
Παρακαλούμε τα σχολιά σας να ειναι σχετικά με το θέμα, περιεκτικά και ευπρεπή. Για την καλύτερη επικοινωνία δώστε κάποιο όνομα ή ψευδώνυμο. Διαφημιστικά σχόλια δεν δημοσιεύονται.
Επειδή δεν υπάρχει η δυνατότητα διόρθωσης του σχολίου σας παρακαλούμε μετά την τελική σύνταξή του να ελέγχεται. Προτιμάτε την ελληνική γραφή κι όχι την λατινική (κοινώς greeklish).
Πολύ σημαντικό είναι να κρατάτε προσωρινό αντίγραφο του σχολίου σας ειδικά όταν είναι εκτενές διότι ενδέχεται να μην γίνει δεκτό από την Google (λόγω μεγέθους) και θα παραστεί η ανάγκη να το σπάσετε σε δύο ή περισσότερα.
Το σχόλιό σας θα δημοσιευθεί, το αργότερο, μέσα σε λίγες ώρες, μετά από έγκριση του διαχειριστή του ιστολογίου, ο οποίος είναι υποχρεωμένος να δημοσιεύει όλα τα σχόλια που δεν παραβαίνουν τους όρους που έχουμε θέσει στις παρούσες οδηγίες.
Υβριστικά, μη ευπρεπή και προπαγανδιστικά σχόλια θα διαγράφονται ή δεν θα δημοσιεύονται.