decembrie 5, 2022

Obiectiv Jurnalul de Tulcea – Citeste ce vrei sa afli

Informații despre România. Selectați subiectele despre care doriți să aflați mai multe

Google face în sfârșit acces public la sistemul său AI

S-a scris mult despre sistemele de inteligență artificială pentru conversia textului în imagine recent. Cu toate acestea, în timp ce OpenAI și Meta AI și-au prezentat modelele AI sau chiar le-au făcut disponibile public, Google a rămas relativ tăcut în ceea ce privește eforturile lor – până săptămâna trecută.

Disponibil acum… un fel de

Potrivit Google, formularul text-to-image al Imagen va fi în sfârșit pus la dispoziția publicului – deși într-un mod foarte limitat, printr-o aplicație AI Test Kitchen, pentru a obține feedback din timp despre tehnologia sa.

AI ​​Test Kitchen a fost introdus la Google I/O la începutul acestui an ca o modalitate prin care oamenii să învețe, să experimenteze și să ofere feedback despre tehnologia AI emergentă. În august, Google în sfârșit anunta Acesta permite publicului să-și înregistreze interesele pe măsură ce acestea sunt distribuite către „grupuri mici de utilizatori din SUA”.

Dar de ce să te deranjezi cu Imagen? Pentru început, o lucrare de cercetare publicată în luna mai a acestui an a arătat o producție similară cu cea a DALL-E 2 Si răspândire stabilă. Cu toate acestea, se pare că Google a acordat o atenție sporită îmbunătățirii acurateței imaginii și alinierii cu introducerea textului prin creșterea dimensiunii modelului de limbă al lui Imagen.

De fapt, Google spune că evaluatorii umani preferă Imagen față de alte modele în comparații unul lângă altul, atât în ​​ceea ce privește calitatea eșantionului, cât și alinierea textului imaginii. Și mostrele afișate pe hârtia lui albă par să demonstreze asta – chiar dacă se presupune că Google arată doar cele mai bune imagini de acolo.

READ  AMD Radeon RX 7600 XT va fi mai rapid decât RX 6900 XT, va fi primul GPU RX 7000 care va fi lansat [Rumor]

Produs de Imagen

ca atare menționat pe mine marginea, Utilizatorii selectați vor putea interacționa cu Imagen prin două interfețe din Bucătăria de testare AI: „City Dreamer” și „Wobble”.

Primul ar permite utilizatorilor să solicite formularului să creeze articole dintr-un oraș conceput în jurul unei teme alese de ei. Modelele vor apărea apoi ca modele izometrice în stil SimCity. În Wobble, utilizatorii pot crea un monstru selectând materialul din care sunt fabricați și purtând hainele la alegere.

Acest lucru este mult mai restrictiv decât DALL-E 2, care permite utilizatorilor să creeze aproape orice în câteva secunde, sau Stable Diffusion, care poate fi descărcat și redat local pe o mașină cu un singur GPU.

De ce limita? Explicația Google pentru lipsa codului open source și a demonstrațiilor ne oferă un indiciu: este îngrijorat de potențialul abuz. Cu toate acestea, ea a promis că va explora un cadru pentru un „străin responsabil, care echilibrează valoarea auditului extern cu riscurile unui acces liber neîngrădit”.

În prezent, cei interesați să acorde serviciul Google text-to-image pot aplica prin aplicația AI ​​Test Kitchen, disponibilă pentru descărcare pe Google Play și iOS App Store.

De asemenea, puteți citi mai multe despre Imagen pe Google Research aici sau accesați hârtia albă aici.

Credit imagine: Google Imagen