Εδώ και χρόνια χρησιμοποιούμε διάφορα εργαλεία με τα οποία διευκολύνουμε την εργασιακή μας, και όχι μόνο ζωή. Τον τελευταίο καιρό εχει γίνει πανικός με τις διάφορες ΑΙ που έχουν ανοίξει ή μισανοίξει τις πόρτες τους στο ευρύ κοινό και που ο καθένας μας ή οι περισσότεροι από μας αν δεν παίξαμε λίγο μαζί τους, συζητάμε, είτε ξέρουμε τι είναι είτε όχι , γι αυτές.
Του Θωμά Τζίρου
Οι πλέον γνωστές ειναι κυριως το ChatGPT και το Midjourney.
Το ChatGPT είναι ένα εργαλείο επεξεργασίας φυσικής γλώσσας που καθοδηγείται από την τεχνολογία AI και μας επιτρέπει να έχουμε συνομιλίες, και πολλά άλλα, που μοιάζουν με ανθρώπινες συνομιλίες με το chatbot. Το γλωσσικό μοντέλο μπορεί να απαντήσει σε ερωτήσεις και να βοηθήσει με εργασίες, όπως η σύνταξη μηνυμάτων ηλεκτρονικού ταχυδρομείου, δοκιμίων και κώδικα.
Το Midjourney είναι ένα πρόγραμμα και μια υπηρεσία τεχνητής νοημοσύνης που δημιουργήθηκε και φιλοξενείται από το ανεξάρτητο ερευνητικό εργαστήριο Midjourney, Inc. με έδρα το Σαν Φρανσίσκο. Το Midjourney παράγει εικόνες από περιγραφές φυσικής γλώσσας, που ονομάζονται » prompts «, παρόμοια με το DALL-E και το Stable Diffusion της OpenAI.
Στην ουσία και στα δυο θα πρέπει να περιγράψουμε τι θέλουμε να πάρουμε ως αποτέλεσμα. Όσο πιο καλά το περιγράψουμε τόσο καλύτερο θα ειναι το αποτέλεσμα. Εγω επαιξα αρχικά με το midjourney πολύ ερασιτεχνικά προσπαθησα να το βαλω να δημιουργησει διαφορες εικόνες ακολουθωντας διαφορετικές τεχνικές γνωστων ζωγράφων. Νομίζω οτι η τελευταια εικονα που δημιουργησα με το εργαλείο ηταν η παρακάτω που πολύ απλοϊκα το δημιουργησα/σε με την παρακάτω περιγραφή/prompt : Masha Amini, protest, Iran, full detailed, Hokusai
ΜΕ to ChatGPT ξεκινησα να παιζω κάνοντας χαβαλέ οπως βλέπουμε στην παρακάτω φωτογραφία. Συνέχισα όμως χρησιμοποιώντας του για κάτι προτάσεις για χρηματοδοτηση σε project που κάνω εδω όπως και σε cover letter αιτησεις για δουλεια στα Γερμανικά.
Στην πορεία είδα διάφορα όμορφα project από γνωστους μου τα οποία με οδηγήσανε στο να αποφασίσω να χάσω όλη την Παρασκευη μου στις 14 Απριλίου και να δω πως θα μπορουσα να χρησιμοποιήσω για την παραγωγη μια προεκλογικής ομιλίας.
Ας το πάρουμε από την αρχή.
Μετά την προκηρυξη εκλογων ο διαδικτυακος μου φίλος Χάρης έκανε μια σειρα πολύ όμορφων ποστερ ανυπαρκτων υποψηφίων ενος ανυπαρκτου κόμματος που μοιάζει με την ΝΔ. Ο δε κάθε υποψήφιος στο ποστερ του ειχε και ένα μοτο/συνθημα το οποίο ήταν συνηθως υπερβολικό όπως και η ιδιότητα του κάθε ανύπαρκτου υποψήφιου. παρακάτω ακολουθουν μερικά δειγματα της δουλειας. Επαναλαμβάνω οτι κανενας από αυτα τα πρόσωπα δεν ειναι πραγματικά. Όλα ειναι φτιαγμενα με το Midjourney
Κάπου την ίδια εποχή ή λιγο πιο μπροστα ο φίλος ο Νικος, ο οποίος ειναι σκηνοθέτης έκανε ενα μικρό project με χρήση διαφόρων ΑΙ για να πάρει το παρακάτω αποτέλεσμα
Βλέποντας λοιπόν όλα αυτα αποφάσισα να χρησιμοποιησω τον τελευταιο υποψήφιο από τους παραπάνω προκειμενου να παράξω ένα προεκλογικό βίντεο για εκπαιδευτικούς σκοπους. Επέλεξα άντρα γιατί είχα ήδη συνδρομη σε μια ΑΙ υπηρεσια που μετατρέπει κείμενο σε φωνή και για ελληνικά, στην συνδρομη που είχα εγω ήταν μόνο αντρική η φωνή.
Βήμα πρώτο: ξεφοντάρισα από το πόστερ τον υποψήφιο. Αυτο το έκανα με κλασική μέθοδο με το photopea που ειναι ελεύθερο εργαολείο στο Ιντερνετ. Υπάρχουν όμως ΑΙ που κάνουν την ίδια δουλειά όπως π.χ το Picwish.
Βήμα δευτερο: πήγα στο ChatGPT και ζήτησα να μου γράψει έναν προεκλογικό λόγο όχι πάνω απο 5 λεπτά για τον Ρένο Ξυπολυτά, ειδικό σύμβουλο σε σεμινάρια UEFA Pro, υποψήφιο με το κόμμα της Νεας Αριστοκρατίας όπου θα συστηνεται, θα εξηγεί το πολιτικό του σχέδιο που στηρίζεται στην απελευθέρωση των εργοδοτών απο την ασυδοσία των εργαζομένων και στο τελος θα ζητά την ψήφο των πολιτων.Χρειάστηκε να κάνω κάποιες ελαφρές διορθώσεις εδω.
Βήμα τρίτο: Πήρα το κείμενο και το έριξα στην υπηρεσία όπου είχα συνδρομή, στην Blaster Suite και συγκεκριμενα στο Speechelo, επιλέγοντας ως γλώσσα τα ελληνικά. Δυστυχώς, λόγω επιπέδου συνδρομής, δεν είχα την δυνατότητα στην συγκεκριμένη γλώσσα να κάνω διορθώσεις οπότε ακούγεται τεχνητη και όχι ιδιαιτερα φυσική. Υπάρχουν βέβαια πολλές άλλες τετοιες υπηρεσιες.
Βήμα τέταρτο: αυτό ήταν που μου έφαγε και τον περισσότερο χρόνο μια και έπρεπε να γράψω script σε JSON και εγω δεν έχω ιδέα. Πήγα στην ΑΙ που λέγεται D-ID, έκανα μια δωρεαν εγγραφη για 14 μέρες και εφερα την εικόνα που είχα ξεφοντάρει αλλά και το ηχητικό προκειμένου να τα συνθέσω με JSON script έτσι ώστε να δημιουργηθεί ένα βιντεο που να βλέπετε κάπως. Εψαξα παντου παραδείγματα και μετα απο πάρα πολλές διορθώσεις πήρα κάτι υποφερτό. Ήταν ένα βίντεο με μαύρο background και τον υποψήφιο μου να μιλά με το υδατογράφημα του D-ID
Βήμα πέμπτο: Πηρα και επεξεργάστηκα το βιντεο, πολύ πρόχειρα είναι η αλήθεια, στο Davinci resolve προσθετοντας μουσική με άδεια CC και διάφορες εικονες ως οπτικοποίηση του λόγου του υποψήφιου. και το αποτελεσμα το σήκωσα στο Youtube σε private link, το οποιο σημερα το έκανα public. Επίτηδες αφησα το υδατογράφημα της ΑΙ για να ειναι ξεκαθαρο οτι προκειται περι ψευτικου βίντεο, θα μπορουσα να το είχα αφαιρέσει.
Το αποτέλεσμα δεν ειναι τετοιο ώστε να γίνει πιστευτο ως ένα πραγματικό βίντεο. Όμως αν εγω άσχετος παρηγαγα αυτο με οτι ΑΙ βρηκα τζάμπα σε μια μέρα, τι μπορει να κάνει κάποιος πολύ καλύτερος από μένα με πολύ καλύτερα εργαλεία;
Αυτό αναρωτιουμουνε την μέρα που το έκανα ώσπου οι Ρεπουμπλικάνοι κάνανε με ΑΙ την παρακάτω πολιτική αντιδιαφημιση την μέρα που ανακοίνωσε ο Biden οτι θα διεκδικήσει το χρισμα το 2024
Λεπτομέρειες μπορείτε να διαβάσετε εδω και εδω.
Δεν πρόκειται να αναπτυξω εκθεση ιδεων για τι τι πρέπει να γίνει. Το project που έκανα το έκανα για να δω τι θα μπορουσα να κανω χρησιμοποιώντας τα καινουργια εργαλεία. Το ποστ το έγραψα για να έχω α) μια καταγραφη του τι έχω κάνει σε περιπτωση που αρχίσω να ξεχνάω επειδη γερναω και β) για να σας βάω σε σκέψεις, όσοι το διαβάσετε. Δεν είναι λίγα τα χάπατα που χάφτουν οτι τους σερβιρουν στο Ιντερνετ, φαντάζεστε τι θα γίνει όταν αρχίσουν να κυκλοφορουν και ΑΙ βιντεο προς επιβεβαιωση διαφόρων θεωριών.