Τεχνητή Νοημοσύνη vs. Ανθρώπου στα Μαθηματικά: Έφτασε το Χρυσό, Όχι την Κορυφή
Σε έναν συναρπαστικό αγώνα νοημοσύνης, οι άνθρωποι ξεπέρασαν τα προηγμένα μοντέλα τεχνητής νοημοσύνης της Google και της OpenAI στον κορυφαίο διεθνή διαγωνισμό μαθηματικών, την Διεθνή Μαθηματική Ολυμπιάδα (IMO). Παρόλο που τα προγράμματα τεχνητής νοημοσύνης κατάφεραν για πρώτη φορά να επιτύχουν σκορ επιπέδου χρυσού μεταλλίου, δεν κατάφεραν να φτάσουν το απόλυτο σκορ, σε αντίθεση με πέντε ανθρώπινους διαγωνιζόμενους.
Η ΤΝ Φτάνει το «Χρυσό» Όριο
Η Google ανακοίνωσε ότι μια προχωρημένη έκδοση του chatbot Gemini έλυσε πέντε από τα έξι μαθηματικά προβλήματα που τέθηκαν στην IMO του 2025, η οποία διεξήχθη στην Αυστραλία. Συγκεκριμένα, το Google DeepMind συγκέντρωσε 35 από τους 42 δυνατούς πόντους, ένα σκορ που αντιστοιχεί σε χρυσό μετάλλιο. Ο πρόεδρος της IMO, Γκρέγκορ Ντολινάρ, επαίνεσε τις λύσεις, χαρακτηρίζοντάς τες «σαφείς, ακριβείς και ως επί το πλείστον εύκολες στην παρακολούθηση».
Αντίστοιχα, η OpenAI, κατασκευάστρια του ChatGPT, δήλωσε ότι το πειραματικό της μοντέλο λογικής επίσης πέτυχε σκορ 35 πόντων, δηλαδή χρυσού μεταλλίου, στην ίδια δοκιμασία. Ο ερευνητής της OpenAI, Αλεξάντερ Γουέι, τόνισε ότι αυτό το αποτέλεσμα «πέτυχε μια μακροχρόνια πρόκληση της ΤΝ» στον «πιο υψηλού κύρους μαθηματικό διαγωνισμό στον κόσμο».
Οι Άνθρωποι στην Κορυφή: 42 Πόντοι
Παρά την εντυπωσιακή επίδοση της ΤΝ, οι ανθρώπινοι διαγωνιζόμενοι απέδειξαν την ανωτερότητά τους. Περίπου το 10% των ανθρώπινων συμμετεχόντων κέρδισε χρυσό μετάλλιο, ενώ πέντε εξ αυτών πέτυχαν το απόλυτο σκορ των 42 πόντων, κάτι που κανένα μοντέλο ΤΝ δεν κατάφερε. Αυτό υπογραμμίζει τη διαφορά μεταξύ της επίτευξης ενός υψηλού επιπέδου επίδοσης και της απόλυτης τελειότητας, η οποία, προς το παρόν, παραμένει προνόμιο της ανθρώπινης νοημοσύνης.
Ταχύτερη Πρόοδος, Νέα Ερωτήματα
Η πρόοδος της ΤΝ είναι αναμφισβήτητη. Η Google είχε πετύχει σκορ αργυρού μεταλλίου στην περσινή IMO, λύνοντας τέσσερα προβλήματα σε δύο έως τρεις ημέρες υπολογισμών. Φέτος, το μοντέλο Gemini έλυσε τα προβλήματα εντός του χρονικού ορίου των 4,5 ωρών, δείχνοντας μια δραματική βελτίωση στην αποτελεσματικότητα.
Ωστόσο, οι διοργανωτές της IMO επισημαίνουν ότι, ενώ τεχνολογικές εταιρείες δοκίμασαν ιδιωτικά, μη ανοιχτού κώδικα μοντέλα ΤΝ στα φετινά προβλήματα (τα ίδια που αντιμετώπισαν οι 641 φοιτητές από 112 χώρες), δεν μπόρεσαν να επαληθεύσουν πόση υπολογιστική ισχύς χρησιμοποιήθηκε ή αν υπήρξε ανθρώπινη παρέμβαση κατά τη διάρκεια της διαδικασίας. Αυτό θέτει σημαντικά ερωτήματα σχετικά με την πλήρη αυτονομία και τις πραγματικές δυνατότητες αυτών των συστημάτων σε συνθήκες διαγωνισμού.
Συνολικά, τα αποτελέσματα δείχνουν ότι η Τεχνητή Νοημοσύνη κάνει άλματα στις μαθηματικές ικανότητες, αλλά η ανθρώπινη δημιουργικότητα, η ενσυναίσθηση και η ικανότητα να επιτυγχάνουν το "απόλυτο" σε σύνθετα προβλήματα, διατηρούν ακόμα το προβάδισμά τους.
Πώς πιστεύετε ότι θα εξελιχθεί η σχέση ανθρώπου-ΤΝ σε τέτοιους διαγωνισμούς στο μέλλον;

Δημοσίευση σχολίου
Σημείωση: Μόνο ένα μέλος αυτού του ιστολογίου μπορεί να αναρτήσει σχόλιο.