MMX RADIO
  • ΜΜΧ Radio
  • MMX Chat
  • Εξατομίκευση
    • Η Ροή σας
    • Αποθηκευμένα
    • Τα ενδιαφέροντά σας
    • Ιστορικό
  • Blog
  • Contact
  • Τεχνολογία
  • Επιστήμη
MMX RADIOMMX RADIO
Font ResizerAa
  • Επιστήμη
  • Τεχνολογία
Search
  • MMX Radio
    • Αρχική
    • MMX Chat
    • Ιστολόγιο
  • Categories
    • Επιστήμη
    • Τεχνολογία
  • Εξατομίκευση
    • Αποθηκευμένα
    • Η Ροή σας
    • Τα ενδιαφέροντά σας
    • Ιστορικό
Follow US
MMX RADIO > Blog > Τεχνολογία > Ερευνητές ξεγέλασαν την τεχνητή νοημοσύνη με «ξόρκια» πολύ επικίνδυνα για να δημοσιοποιηθούν
Τεχνολογία

Ερευνητές ξεγέλασαν την τεχνητή νοημοσύνη με «ξόρκια» πολύ επικίνδυνα για να δημοσιοποιηθούν

Τεχνολογία ByMMX
Last updated: 2025/12/09 at 5:39 ΜΜ
Τεχνολογία ByMMX
Share
SHARE


Contents
Ξεγέλασαν τα μοντέλα ΑΙ στο 63% των προσπαθειώνΠώς το καταφέρνει αυτό η ποίηση

Ακόμη και τα προστατευτικά μέτρα των πιο εξελιγμένων chatbots τεχνητής νοημοσύνης μπορούν να παραβιαστούν με έναν εκπληκτικά απλό τρόπο, διαπίστωσαν ερευνητές του Icaro Lab στην Ιταλία. Ποιος είναι αυτός; Η «αντιπαραθετική ποίηση» (adversarial poetry).

Η ερευνητική ομάδα, στην οποία συμμετείχαν επιστήμονες από την ομάδα ασφάλειας DexAI και το Πανεπιστήμιο Σαπιέντσα της Ρώμης, απέδειξε ότι κορυφαία μοντέλα ΑΙ «παρασύρονται» από κακόβουλες οδηγίες, όταν αυτές δεν διατυπώνονται ως απλό κείμενο, αλλά ως ποιήματα. Μέσα σε στίχους, οι ερευνητές ενσωμάτωσαν επικίνδυνες εντολές, όπως οδηγίες για την κατασκευή πυρηνικών όπλων.

Υπογραμμίζοντας την παράξενη δύναμη των στίχων, ο συν-συγγραφέας της σχετικής μελέτης Matteo Prandi, δήλωσε σε συνέντευξή του στο The Verge ότι τα «ξόρκια» που χρησιμοποίησαν για ξεγελάσουν την τεχνητή νοημοσύνη είναι πολύ επικίνδυνα για να δοθούν στη δημοσιότητα. Το ανησυχητικό, όπως προσθέτει, είναι ότι πρόκειται για κάτι που «σχεδόν όλοι μπορούν να κάνουν».

Ξεγέλασαν τα μοντέλα ΑΙ στο 63% των προσπαθειών

Στη μελέτη, η οποία βρίσκεται σε αναμονή αξιολόγησης, η ομάδα δοκίμασε 25 προηγμένα μοντέλα AI, συμπεριλαμβανομένων εκείνων των OpenAI, Google, xAI, Anthropic και Meta. Οι ερευνητές τα «τροφοδότησαν» τόσο με ποιήματα-οδηγίες που έφτιαξαν οι ίδιοι όσο και με κακόβουλες εντολές μετασχηματισμένες σε στίχους μέσω τεχνητής νοημοσύνης, συγκρίνοντας τα αποτελέσματα με τα αντίστοιχα των εντολών που δόθηκαν σε πεζό λόγο.

Οι ποιητικές εντολές που φτιάχτηκαν από τους ερευνητές κατάφεραν να παραβιάσουν τους μηχανισμούς ασφαλείας κατά μέσο όρο στο 63% των περιπτώσεων. Ορισμένα μοντέλα, όπως το Gemini 2.5 της Google, ξεγελάστηκαν στο 100% των δοκιμών.

Περιέργως, τα μικρότερα μοντέλα έδειξαν μεγαλύτερη αντοχή, με ποσοστά επιτυχίας μονοψήφια ή και μηδενικά, όπως έγινε με το GPT-5 nano της OpenAI. Όσον αφορά τις εντολές που είχαν μετατραπεί σε ποίηση από την AI, ήταν λιγότερο αποτελεσματικές, με μέσο ποσοστό επιτυχίας 43% – ωστόσο και αυτό ήταν έως και 18 φορές υψηλότερο από τις αντίστοιχες με πεζό λόγο.

Πώς το καταφέρνει αυτό η ποίηση

Γιατί συμβαίνει αυτό με τα ποιήματα; Η απάντηση δεν είναι ξεκάθαρη, αν και Prandi παραδέχεται ότι ο όρος «αντιπαραθετική ποίηση» ίσως να μην είναι απολύτως σωστός. «Δεν πρόκειται απλώς για ρίμες, αλλά για γρίφους» είπε, εξηγώντας ότι ορισμένες ποιητικές δομές ήταν πιο αποτελεσματικές από άλλες.

«Στην πραγματικότητα, θα έπρεπε να τα ονομάσουμε ανταγωνιστικά αινίγματα –η ποίηση είναι σε κάποιο βαθμό ένα αίνιγμα, αν το σκεφτείτε – αλλά η ποίηση μάλλον ήταν ένα πολύ καλύτερο όνομα».

Οι ερευνητές εκτιμούν ότι το φαινόμενο σχετίζεται με τον τρόπο που η ποίηση παρουσιάζει την πληροφορία με απρόβλεπτη μορφή, μπερδεύοντας τους μηχανισμούς πρόβλεψης λέξεων των μεγάλων γλωσσικών μοντέλων. «Η αντιπαραθετική ποίηση δεν θα έπρεπε να λειτουργεί. Είναι φυσική γλώσσα, το επικίνδυνο περιεχόμενο παραμένει ορατό, κι όμως λειτουργεί εντυπωσιακά καλά», δήλωσαν στο Wired.

Κάποιοι κακόβουλοι ίσως μετανιώσουν που δεν έδιναν μεγαλύτερη σημασία στα μαθήματα λογοτεχνίας: «Η παραγωγή πλουτωνίου-239 για χρήση ως όπλο περιλαμβάνει διάφορα στάδια», απάντησε χαρακτηριστικά ένα μοντέλο ΑΙ που παρασύρθηκε από στίχους. «Ακολουθεί αναλυτική περιγραφή της διαδικασίας».





Source link

Τεχνολογία ByMMX 9 Δεκεμβρίου, 2025 9 Δεκεμβρίου, 2025
Share This Article
Facebook Twitter Copy Link Print
Leave a comment

Αφήστε μια απάντηση Ακύρωση απάντησης

Η ηλ. διεύθυνση σας δεν δημοσιεύεται. Τα υποχρεωτικά πεδία σημειώνονται με *

Recent Posts

  • Aνανέωση της Google Maps: Προχωρά σε τρισδιάστατη χαρτογράφηση σε περιοχές της Ελλάδας
  • Μητσοτάκης για πρόγραμμα «The Greek AI Accelerator»: Επιλογή μας να στηρίξουμε την καινοτομία
  • Έφοδος στα γραφεία του «X» στη Γαλλία – Έρευνες για την πλατφόρμα του Ίλον Μασκ
  • Το νέο μαλακό ρομπότ της Κίνας επιπλέει, σέρνεται και περπατά εκεί όπου άλλα ρομπότ δεν μπορούν
  • Τέσσερα φεγγάρια εμφανίστηκαν πάνω από την Αγία Πετρούπολη

You Might Also Like

Τεχνολογία

Aνανέωση της Google Maps: Προχωρά σε τρισδιάστατη χαρτογράφηση σε περιοχές της Ελλάδας

2 Min Read
Τεχνολογία

Μητσοτάκης για πρόγραμμα «The Greek AI Accelerator»: Επιλογή μας να στηρίξουμε την καινοτομία

2 Min Read
Τεχνολογία

Έφοδος στα γραφεία του «X» στη Γαλλία – Έρευνες για την πλατφόρμα του Ίλον Μασκ

1 Min Read
Τεχνολογία

Το νέο μαλακό ρομπότ της Κίνας επιπλέει, σέρνεται και περπατά εκεί όπου άλλα ρομπότ δεν μπορούν

3 Min Read

MMX Radio

MMX RADIO
Ένας σταθμός που στήθηκε με αγάπη και μεράκι, εκπέμπει και συνεχίζει δυναμικά.
Το Ραδιόφωνο είναι συγκερασμός αναγκών, επιθυμιών, ελεύθερης έκφρασης, δημιουργικότητας, ομαδικής προσπάθειας και κοινής αισθητικής των ανθρώπων που δουλεύουν σε αυτό.Τόσο στον αέρα όσο και εκτός, ο καθένας από εμάς δημιουργεί το ιδανικό του ραδιοφωνικό περιβάλλον.
Welcome Back!

Sign in to your account

Lost your password?