Indice
A Intelligenza artificiale di Googleo Gemini, ha ricevuto un nuovo ed innovativo aggiornamento questo martedì, 9 aprile, durante il Google Cloud Avanti. Con l'aggiornamento, il Gemelli 1.5 Pro, ha ricevuto la capacità di comprendere e analizzare linee audio e video, producendo contenuti in base a quanto inserito nell'applicazione.
Inizialmente, la nuova funzionalità è disponibile solo per gli utenti di Vertice AI, software mirato a machine learning (machine learning), utilizzato da programmatori e scienziati per sviluppare nuove IA.
Cosa fa Gemini, l'intelligenza artificiale di Google?
O Gemini, l'intelligenza artificiale di Google, è stata lanciata a dicembre dello scorso anno, in sostituzione di Bardo, e si distingue per la sua capacità di gestire compiti altamente complessi, dalla codifica al ragionamento logico raffinato.
L'intelligenza artificiale dispone di funzioni in grado di assistere l'utente nei compiti più diversi, manipolando un'ampia varietà di file, con lo scopo di combinare diversi tipi di informazioni, oltre a organizzarle. Le sue funzionalità consentono di utilizzare diversi formati di contenuto, tra cui:
- testi;
- immagini;
- audio;
- video; È
- linguaggi di programmazione.
O Gemini Dispone di tre modalità operative, con diverse specificità:
- Gemelli Ultra — più grandi e più capaci per compiti altamente complessi;
- Gemelli Pro - ideale per scalare un'ampia varietà di attività;
- Gemelli Nano — più efficiente per le attività mobili.
Aggiornamento Gemini 1.5 Pro e le sue nuove funzioni
Questo nuovo modello, presentato dal colosso tecnologico, rappresenta un notevole passo avanti rispetto al precedente, con miglioramenti nelle prestazioni e nella comprensione dei contesti lunghi. Il Gemini 1.5 Pro, che è la versione iniziale resa disponibile per i test, è ottimizzata per una varietà di compiti ed è più efficiente in termini di calcolo, essendo una versione più robusta e in grado di soddisfare i requisiti di attività ancora più complesse.
Inoltre, il Gemelli 1.5 Pro contiene una risorsa sperimentale che, in teoria, potrebbe elaborare fino a 1 milione di gettoni per modelli base su larga scala, che saranno rivoluzionari. Secondo Google, questa immensa quantità rappresenta 700.000 parole e 30.000 righe di codice, che equivale a un'ora di video ou 11 ore di audio.
Nuovi strumenti in Gemini 1.5 Pro consentono all'applicazione di ragionare tra immagini (fotogrammi) e audio (discorso) per i video caricati sul Studio sull'intelligenza artificiale di Google, che faciliterà la produzione di contenuti. Secondo le informazioni ufficiali, l'aggiornamento AI di Google è disponibile in più di 180 paesi attraverso l'API Gemini (Application Programming Interface, in portoghese), con una capacità nativa senza precedenti di comprendere l'audio e una nuova API che facilita la gestione dei file.
La versione include anche nuove istruzioni di sistema e funzionalità della modalità. JSON (formato dati leggero per lo scambio di informazioni tra sistemi informatici). Credendo nel potenziale del nuovo aggiornamento, Google promette che il modello di incorporamento del testo supererà i concorrenti con funzioni simili.
O Gemelli 1.5 Pro è attualmente disponibile solo tramite IA del vertice.
Imagen 2 può creare GIF
durante l'evento Google Cloud Avanti, un altro importante annuncio è stato fatto da Google: il modello AI Imagen 2, da cui è possibile generare immagini e brevi video istruzioni di testo. Con questo è possibile creare GIF fino a quattro secondi da diverse angolazioni della telecamera e mostrare anche il movimento.
La differenza con questo strumento è proprio la possibilità di esplorare angoli diversi, con più dinamismo nelle scene, ben oltre i video AI generati con foto statiche e movimenti limitati.
O Imagen 2 ha la capacità di produrre video clip, noti anche come immagini live, a bassa risoluzione 640 x 360. Inoltre, Google sta utilizzando la sua tecnica SynthID applicare a filigrana invisibile in clip e immagini generate dall'intelligenza artificiale. La società sostiene che il SynthID può supportare modifiche e persino compressione, misure che mirano a promuovere sicurezza dei dati.
Ad oggi, le risorse di Imagen 2 sono disponibili solo tramite IA del vertice, che ora include il supporto per la verniciatura interna ed esterna, nonché la possibilità di modificare le immagini utilizzando l'intelligenza artificiale, consentendo di espandere i bordi o aggiungere/rimuovere parti specifiche dell'immagine. Strumenti rivolti ai professionisti del marketing e alla creazione di contenuti per campagne, tra gli altri pezzi pubblicitari e piattaforme video.
IA del vertice
O IA del vertice è una piattaforma machine learning (ML) che consente la formazione e l'implementazione di strumenti e applicazioni di intelligenza artificiale, inclusa la personalizzazione di modelli linguistici di grandi dimensioni (LLM) da utilizzare in applicazioni basate sull'intelligenza artificiale.
La piattaforma riunisce le diverse funzionalità e applicazioni di Google, integrando flussi di lavoro di ingegneria dei dati, scienza dei dati e ingegneria dei dati. machine learning, consentendo la collaborazione tra i team attraverso un set comune di strumenti, nonché la scalabilità delle applicazioni con i vantaggi di Google Cloud.
A Vertice AI offre diverse opzioni per l'addestramento e la distribuzione dei modelli:
- AutoML consente di addestrare dati tabulari, immagine, testo o video senza la necessità di scrivere codice o preparare suddivisioni dei dati.
- La formazione personalizzata ti dà il pieno controllo sul processo di formazione, compreso l'utilizzo di contesto codice ML preferito, codifica di addestramento personalizzata e selezione di opzioni di ottimizzazione degli iperparametri.
- giardino modello Consente il rilevamento, il test, la personalizzazione e l'implementazione dei modelli Vertex AI, inclusa la selezione del modello e le risorse open source (OSS).
- A IA generativa offre l'accesso ai grandi modelli di intelligenza artificiale generativa di Google in molteplici modalità (testo, codice, immagini, parlato). Puoi ottimizzare i LLM di Google per soddisfare le tue esigenze e distribuirli per l'utilizzo nelle tue applicazioni basate sull'intelligenza artificiale.
Fonte: La Verge, Google per gli sviluppatori, La guida di Tom, Beebom, Google Cloud
Vedi anche:
Recensito da Glaucone Vitale il 10/4/24.
Scopri di più su Showmetech
Iscriviti per ricevere le nostre ultime novità via e-mail.