Τριάντα από τους πιο γνωστούς μαθηματικούς στον κόσμο σε μια συνάντηση που έγινε στα μέσα Μαΐου στο Μπέρκλεϊ της Καλιφόρνια μακριά από τα φώτα της δημοσιότητας, αντιμετώπισαν ένα chatbot σχεδιασμένο να λύνει δύσκολα μαθηματικά προβλήματα. Οι μαθηματικοί έφτιαξαν οι ίδιοι πρωτότυπα μαθηματικά προβλήματα και τα έδωσαν στο πρόγραμμα για να το δοκιμάσουν. Μετά από δύο ημέρες έμειναν έκπληκτοι όταν ανακάλυψαν πως ήταν ικανό να απαντήσει σε μερικά από τα πιο δύσκολα μαθηματικά προβλήματα. Ο Κεν Όνο μαθηματικός στο Πανεπιστήμιο της Βιρτζίνια και ένας από τους διοργανωτές της συνάντησης, δήλωσε: «Έχω συναδέλφους που είπαν ότι αυτά τα μοντέλα πλησιάζουν μαθηματική ιδιοφυΐα»Το νέο chatbot βασίζεται στο o4-mini, ένα νέο είδος μεγάλου γλωσσικού μοντέλου (Large Language Model-LLM) που σχεδιάστηκε να κάνει πολύπλοκες λογικές σκέψεις. Ένα παρόμοιο μοντέλο της Google, το Gemini 2.5 Flash, έχει αντίστοιχες ικανότητες. Όπως και τα παλιότερα μοντέλα του ChatGPT, το o4-mini έχει μάθει να προβλέπει την επόμενη λέξη σε μια πρόταση. Όμως, σε αντίθεση με τα παλιότερα, είναι πιο ελαφρύ και πιο έξυπνα εκπαιδευμένο, χρησιμοποιώντας ειδικά δεδομένα και περισσότερη βοήθεια από ανθρώπους. Αυτό το κάνει ικανό να λύνει πολύ πιο δύσκολα μαθηματικά προβλήματα.Για να παρακολουθήσει την πρόοδο του o4-mini, η OpenAI ανέθεσε στην Epoch AI, έναν ανεξάρτητο οργανισμό που αξιολογεί τα LLM, να βρει 300 μαθηματικά προβλήματα των οποίων οι λύσεις δεν υπήρχαν πουθένα δημοσιευμένες. Βέβαια και τα παραδοσιακά LLM μπορούν να απαντήσουν σωστά σε περίπλοκα μαθηματικά ερωτήματα. Ωστόσο, όταν η Epoch AI έθεσε σε πολλά τέτοια μοντέλα αυτές τις ερωτήσεις, οι οποίες ήταν διαφορετικές σε σχέση με αυτές που είχαν εκπαιδευτεί, τα περισσότερα απέτυχαν, ενώ τα πιο επιτυχημένα κατάφεραν να λύσουν λιγότερα από το 2% των προβλημάτων, δείχνοντας ότι αυτά τα προγράμματα δεν είχαν την ικανότητα να σκέφτονται. Αλλά το o4-mini αποδείχθηκε πολύ διαφορετικό.Η Epoch AI προσέλαβε τον Elliot Glazer, ο οποίος προαφάτως είχε ολοκληρώσει το διδακτορικό του στα μαθηματικά, για να συμμετάσχει στη νέα έρευνα, με την ονομασία FrontierMath, τον Σεπτέμβριο του 2024. Η έρευνα συγκέντρωσε νέες ερωτήσεις με ποικίλα επίπεδα δυσκολίας, με τα τρία πρώτα επίπεδα να καλύπτουν προκλήσεις σε προπτυχιακό, μεταπτυχιακό και ερευνητικό επίπεδο. Μέχρι τον Απρίλιο του 2025, ο Glazer διαπίστωσε ότι το o4-mini μπορούσε να λύσει περίπου το 20% των ερωτήσεων. Στη συνέχεια, προχώρησε σε ένα τέταρτο επίπεδο: ένα σύνολο ερωτήσεων που θα ήταν δύσκολο ακόμη και για έναν ακαδημαϊκό μαθηματικό. Μόνο μια μικρή ομάδα ανθρώπων στον κόσμο θα ήταν σε θέση να αναπτύξει τέτοιες ερωτήσεις, πόσο μάλλον να τις απαντήσει. Οι μαθηματικοί που συμμετείχαν έπρεπε να υπογράψουν μια συμφωνία εμπιστευτικότητας που απαιτούσε να επικοινωνούν αποκλειστικά μέσω της εφαρμογής ανταλλαγής μηνυμάτων Signal. Άλλες μορφές επικοινωνίας, όπως το παραδοσιακό email, θα μπορούσαν ενδεχομένως να σαρωθούν από ένα πρόγραμμα LLM και να το εκπαιδεύσουν ακούσια, μολύνοντας έτσι το σύνολο δεδομένων.Κάθε πρόβλημα που δεν μπορούσε να λύσει το o4-mini θα απέδιδε στον μαθηματικό που το επινόησε μια αμοιβή 7.500 δολαρίων. Η ομάδα σημείωσε αργή, σταθερή πρόοδο στην εύρεση ερωτήσεων. Αλλά ο Glazer ήθελε να επιταχύνει τα πράγματα, οπότε η Epoch AI φιλοξένησε τη συνάντηση με φυσική παρουσία το Σάββατο 17 Μαΐου και την Κυριακή 18 Μαΐου. Εκεί, οι συμμετέχοντες θα οριστικοποιούσαν την τελευταία ομάδα ερωτήσεων. Οι 30 συμμετέχοντες χωρίστηκαν σε ομάδες των έξι. Για δύο ημέρες, οι μαθηματικοί ανταγωνίζονταν μεταξύ τους για να επινοήσουν προβλήματα που μπορούσαν να λύσουν, αλλά θα δυσκόλευαν την Τεχνητή Νοημοσύνη. Το πρόγραμμα τελικά όχι μόνο άρχισε να παρουσιάζει έξυπνες λύσεις, αλλά έδειχνε και θρασύτητα: σε κάποια φάση όταν ρωτήθηκε για την πηγή που χρησιμοποίησε σε κάποιον υπολογισμό του, απάντησε: «Δεν χρειάζεται παραπομπή αφού ο υπολογισμός έγινε από εμένα!»Παρότι οι προσκεκλημένοι μαθηματικοί κατάφεραν τελικά να βρούν 10 ερωτήσεις που δυσκόλεψαν το πρόγραμμα, έμειναν έκπληκτοι από το πόσο είχε προχωρήσει η Τεχνητή Νοημοσύνη σε διάστημα ενός έτους. Πέρα από την ταχύτητά της, χρειαζόταν μόλις λίγα λεπτά για να κάνει αυτό που ένας επαγγελματίας μαθηματικός θα χρειαζόταν εβδομάδες ή και μήνες για να ολοκληρώσει. Σύμφωνα με τις δηλώσεις των μαθηματικών που συμετείχαν στην συνάντησης, οι επιδόσεις του προγράμματος o4-mini ξεπερνούν αυτή τη στιγμή τις ικανότητες των καλύτερων μεταπτυχιακών φοιτητών στον κόσμο!διαβάστε περισσότερα:1. At Secret Math Meeting, Researchers Struggle to Outsmart AI – https://www.scientificamerican.com/article/inside-the-secret-meeting-where-mathematicians-struggled-to-outsmart-ai/2. Mathematicians interact with AI, July 2025 – https://www.math.columbia.edu/~woit/wordpress/Πηγή:https://physicsgg.me/