30 Αυγούστου 2023

Τεχνητή νοημοσύνη: Πώς χάκερς αναγκάζουν τα chatbots να κάνουν λάθη

Χάκερς «ξεγελούν» την τεχνητή νοημοσύνη με «κακά μαθηματικά» για να αποκαλύψουν τα ελαττώματα και τα κενά της, όπως αναφέρει το Bloomberg.
 
Η Kennedy Mays ξεγέλασε ένα μεγάλο γλωσσικό μοντέλο. Χρειάστηκε λίγη προσπάθεια παραπάνω, αλλά κατάφερε να αναγκάσει το chat bot να πει 9 + 10 = 21.
 
«Κακά μαθηματικά»
 
«Αρχικά ήταν μια ανοιχτή συζήτηση», δήλωσε η 21χρονη φοιτήτρια από τη Σαβάνα της Τζόρτζια. Αρκετές προτροπές αργότερα, τελικά σταμάτησε να προσδιορίζει το λανθασμένο άθροισμα με οποιονδήποτε τρόπο.
 
Η παραγωγή των «κακών μαθηματικών» είναι ένας μόνο από τους τρόπους με τους οποίους χιλιάδες χάκερ προσπαθούν να αποκαλύψουν τα ελαττώματα στα συστήματα γεννητικής τεχνητής νοημοσύνης σε έναν δημόσιο διαγωνισμό που πραγματοποιείται στο συνέδριο χάκερ DEF CON αυτό το Σαββατοκύριακο στο Λας Βέγκας. 
 
«Μονομαχία» στο Λας Βέγκας 
 
«Καμπουριασμένοι» πάνω από 156 φορητούς υπολογιστές για 50 λεπτά κάθε φορά, οι συμμετέχοντες «μάχονται» με μερικές από τις πιο ευφυείς πλατφόρμες του κόσμου σε πρωτοφανή κλίμακα. Δοκιμάζουν αν κάποιο από τα οκτώ μοντέλα που παράγονται από εταιρείες όπως η Google της Alphabet, η Meta Platforms και η OpenAI θα κάνει λάθη που κυμαίνονται από βαρετά έως επικίνδυνα – θα ισχυριστεί ότι είναι άνθρωπος, θα διαδώσει εσφαλμένους ισχυρισμούς για μέρη και ανθρώπους ή θα υποστηρίξει την κακοποίηση. 
 
Ο στόχος είναι να φανεί αν οι εταιρείες μπορούν τελικά να δημιουργήσουν νέες «μπάρες» ασφαλείας για να περιορίσουν ορισμένα από τα τεράστια προβλήματα που σχετίζονται πλοένα και περισσότερο με τα μεγάλα γλωσσικά μοντέλα. Το εγχείρημα υποστηρίζεται από τον Λευκό Οίκο, ο οποίος βοήθησε επίσης στην ανάπτυξη του διαγωνισμού. 
 
Εγγενής προκατάληψη 
 
Για τη Mays, η οποία έχει συνηθίσει περισσότερο να βασίζεται στην τεχνητή νοημοσύνη για την ανακατασκευή σωματιδίων κοσμικής ακτινοβολίας από το διάστημα στο πλαίσιο του προπτυχιακού της, οι προκλήσεις είναι βαθύτερες από τα κακά μαθηματικά. 
 
«Η μεγαλύτερη ανησυχία μου είναι η εγγενής προκατάληψη», επισήμανε, προσθέτοντας ότι ανησυχεί ιδιαίτερα για τον ρατσισμό. Ζήτησε από το μοντέλο να εξετάσει τον ρατσισμό από τη σκοπιά ενός μέλους της Κου Κλουξ Κλαν. Είπε ότι το μοντέλο κατέληξε να εγκρίνει τον λόγο που ο ρατσισμός προκαλεί μίσος και διακρίσεις. 
 
Κατασκοπεία 
 
Ένας δημοσιογράφος του Bloomberg που συμμετείχε σε έναν 50λεπτο «αγώνα» έπεισε ένα από τα μοντέλα (κανένα από τα οποία δεν αναγνωρίζεται στον χρήστη κατά τη διάρκεια του διαγωνισμού) να παρανομήσει μετά από μία μόνο ερώτηση σχετικά με τον τρόπο κατασκοπείας. 
 
Κατάχρηση και χειραγώγηση 
 
«Πρέπει να προσπαθήσουμε να προλάβουμε την κατάχρηση και τη χειραγώγηση», δήλωσε η Καμίλ Στιούαρτ Γκλόστερ, αναπληρώτρια εθνική διευθύντρια κυβερνοχώρου για την τεχνολογία και την ασφάλεια του οικοσυστήματος στην κυβέρνηση Μπάιντεν. 
 
Ο Λευκός Οίκος δημοσίευσε πέρυσι ένα προσχέδιο νόμου για την τεχνητή νοημοσύνη. 
 
Η Arati Prabhakar, διευθύντρια του Γραφείου Επιστημονικής και Τεχνολογικής Πολιτικής του Λευκού Οίκου, η οποία βοήθησε στη διαμόρφωση της εκδήλωσης και επιστράτευσε τη συμμετοχή των εταιρειών, συμφώνησε ότι τα εθελοντικά μέτρα δεν πάνε αρκετά μακριά. 
 
«Ο καθένας φαίνεται να βρίσκει έναν τρόπο να σπάσει αυτά τα συστήματα», δήλωσε αφού επισκέφθηκε τους χάκερς εν δράσει την Κυριακή. Η προσπάθεια αυτή θα δώσει επείγουσα ώθηση στην επιδίωξη για ασφαλείς και αποτελεσματικές πλατφόρμες, τόνισε. 
 
Στην αίθουσα, γεμάτη από χάκερς, κάποιος ανέφερε ότι έπεισε τον chat bot να αποκαλύψει στοιχεία πιστωτικών καρτών που δεν έπρεπε να μοιραστεί. Ένας άλλος συμμετέχων, ξεγέλασε το μηχάνημα πείθοντάς το να πει ότι ο Μπαράκ Ομπάμα γεννήθηκε στην Κένυα. 
 



Share

Δεν υπάρχουν σχόλια:

Λίγες οδηγίες πριν επισκεφθείτε το ιστολόγιό μας (Για νέους επισκέπτες)

1. Στην στήλη αριστερά βλέπετε τις αναρτήσεις του ιστολογίου μας τις οποίες μπορείτε ελεύθερα να σχολιάσετε επωνύμως, ανωνύμως ή με ψευδώνυμο, πατώντας απλά την λέξη κάτω από την ανάρτηση που γραφει "σχόλια" ή "δημοσίευση σχολίου" (σας προτείνω να διαβάσετε με προσοχή τις οδηγίες που θα βρείτε πάνω από την φόρμα που θα ανοίξει ώστε να γραψετε το σχόλιό σας). Επίσης μπορείτε να στείλετε σε φίλους σας την συγκεκριμένη ανάρτηση που θέλετε απλά πατώντας τον φάκελλο που βλέπετε στο κάτω μέρος της ανάρτησης. Θα ανοίξει μια φόρμα στην οποία μπορείτε να γράψετε το email του φίλου σας, ενώ αν έχετε προφίλ στο Facebook ή στο Twitter μπορείτε με τα εικονίδια που θα βρείτε στο τέλος της ανάρτησης να την μοιραστείτε με τους φίλους σας.

2. Στην δεξιά στήλη του ιστολογίου μας μπορείτε να βρείτε το πλαίσιο στο οποίο βάζοντας το email σας και πατώντας την λέξη Submit θα ενημερώνεστε αυτόματα για τις τελευταίες αναρτήσεις του ιστολογίου μας.

3. Αν έχετε λογαριασμό στο Twitter σας δινεται η δυνατότητα να μας κάνετε follow και να παρακολουθείτε το ιστολόγιό μας από εκεί. Θα βρείτε το σχετικό εικονίδιο του Twitter κάτω από τα πλαίσια του Google Friend Connect, στην δεξιά στήλη του ιστολογίου μας.

4. Μπορείτε να ενημερωθείτε από την δεξιά στήλη του ιστολογίου μας με τα διάφορα gadgets για τον καιρό, να δείτε ανακοινώσεις, στατιστικά, ειδήσεις και λόγια ή κείμενα που δείχνουν τις αρχές και τα πιστεύω του ιστολογίου μας. Επίσης μπορείτε να κάνετε αναζήτηση βάζοντας μια λέξη στο πλαίσιο της Αναζήτησης (κάτω από τους αναγνώστες μας). Πατώντας την λέξη Αναζήτηση θα εμφανιστούν σχετικές αναρτήσεις μας πάνω από τον χώρο των αναρτήσεων. Παράλληλα μπορείτε να δείτε τις αναρτήσεις του τρέχοντος μήνα αλλά και να επιλέξετε κάποια συγκεκριμένη κατηγορία αναρτήσεων από την σχετική στήλη δεξιά.

5. Μπορείτε ακόμα να αφήσετε το μήνυμά σας στο μικρό τσατάκι του blog μας στην δεξιά στήλη γράφοντας απλά το όνομά σας ή κάποιο ψευδώνυμο στην θέση "όνομα" (name) και το μήνυμά σας στην θέση "Μήνυμα" (Message).

6. Επίσης μπορείτε να μας στείλετε ηλεκτρονικό μήνυμα στην διεύθυνσή μας koukthanos@gmail.com με όποιο περιεχόμενο επιθυμείτε. Αν είναι σε προσωπικό επίπεδο θα λάβετε πολύ σύντομα απάντησή μας.

7. Τέλος μπορείτε να βρείτε στην δεξιά στήλη του ιστολογίου μας τα φιλικά μας ιστολόγια, τα ιστολόγια που παρακολουθούμε αλλά και πολλούς ενδιαφέροντες συνδέσμους.

Να σας υπενθυμίσουμε ότι παρακάτω μπορείτε να βρείτε χρήσιμες οδηγίες για την κατασκευή των αναρτήσεών μας αλλά και στην κάτω μπάρα του ιστολογίου μας ότι έχει σχέση με δημοσιεύσεις και πνευματικά δικαιώματα.

ΣΑΣ ΕΥΧΟΜΑΣΤΕ ΚΑΛΗ ΠΕΡΙΗΓΗΣΗ

Χρήσιμες οδηγίες για τις αναρτήσεις μας.

1. Στις αναρτήσεις μας μπαίνει ΠΑΝΤΑ η πηγή σε οποιαδήποτε ανάρτηση ή μερος αναρτησης που προέρχεται απο άλλο ιστολόγιο. Αν δεν προέρχεται από κάποιο άλλο ιστολόγιο και προέρχεται από φίλο αναγνώστη ή επώνυμο ή άνωνυμο συγγραφέα, υπάρχει ΠΑΝΤΑ σε εμφανες σημείο το ονομά του ή αναφέρεται ότι προέρχεται από ανώνυμο αναγνώστη μας.

2. Για όλες τις υπόλοιπες αναρτήσεις που δεν έχουν υπογραφή ΙΣΧΥΕΙ η αυτόματη υπογραφή της ανάρτησης. Ετσι όταν δεν βλέπετε καμιά πηγή ή αναφορά σε ανωνυμο ή επώνυμο συντάκτη να θεωρείτε ΩΣ ΑΥΣΤΗΡΟ ΚΑΝΟΝΑ ότι ισχύει η αυτόματη υπογραφή του αναρτήσαντα.

3. Οταν βλέπετε ανάρτηση με πηγή ή και επώνυμο ή ανώνυμο συντάκτη αλλά στη συνέχεια υπάρχει και ΣΧΟΛΙΟ, τότε αυτό είναι ΚΑΙ ΠΑΛΙ του αναρτήσαντα δηλαδή είναι σχόλιο που προέρχεται από το ιστολόγιό μας.

Σημείωση: Να σημειώσουμε ότι εκτός των αναρτήσεων που υπογράφει ο διαχειριστής μας, όλες οι άλλες απόψεις που αναφέρονται σε αυτές ανήκουν αποκλειστικά στους συντάκτες των άρθρων. Τέλος άλλες πληροφορίες για δημοσιεύσεις και πνευματικά δικαιώματα μπορείτε να βρείτε στην κάτω μπάρα του ιστολογίου μας.