OpenAI(ઓપનએઆઈ)ના નવા AI આધારિત ટેક્સ્ટ-ટુ-વિડિયો મોડલે મચાવ્યો હાહાકાર
શું છે OpenAI ‘Sora'(ઓપનએઆઈ ‘સોરા’) ?
OpenAI(ઓપનએઆઈ), ChatGPTના નિર્માતાએ આર્ટિફિશિયલ ઈન્ટેલિજન્સ(Artificial Intelligence)નું નવું સ્વરૂપ બહાર પાડ્યું છે, જે ટેક્સ્ટ પ્રોમ્પ્ટ પર આધારિત વાસ્તવિક વિડિયો બનાવે છે, જેની ઈન્ટરનેટ પર ચારેબાજુ ચર્ચાઓ થઈ રહી છે.
‘સોરા'(‘Sora’)નામનું OpenAI(ઓપનએઆઈ), ChatGPT નું નવું ટેક્સ્ટ-ટુ-વિડિયો મોડલ કે જેને યુઝર્સ openai sora તરીકે ઓળખે છે, તે ભાષાની ઊંડી સમજણ ધરાવે છે અને તે એવા જોરદાર પાત્રો જનરેટ કરી શકે છે કે જે જીવંત લાગણીઓ વ્યક્ત કરે છે.
OpenAI(ઓપનએઆઈ) એ ‘Sora'(‘સોરા’) વિષે શું જણાવ્યું ?
માઇક્રોસોફ્ટ-સમર્થિત સ્ટાર્ટઅપ OpenAI(ઓપનએઆઈ) એ પોતાની એક બ્લોગ પોસ્ટમાં જણાવ્યું હતું કે ‘સોરા'(‘Sora’) નામનું તેમનું નવું ટેક્સ્ટ-ટુ-વિડિયો મોડલ બહુવિધ પાત્રો, ચોક્કસ પ્રકારની ગતિ સહિત વિષય અને પૃષ્ઠભૂમિની ચોક્કસ વિગતો સાથે જટિલ દ્રશ્યો જનરેટ કરવામાં સક્ષમ છે.
OpenAI(ઓપનએઆઈ) એ વધુમાં જણાવ્યું હતું કે, ‘સોરા'(‘Sora’) ટેક્સ્ટ-ટુ-વિડિયો મોડલ મૉડલ માત્ર વપરાશકર્તાએ પ્રોમ્પ્ટમાં શું માંગ્યું છે તે જ નહીં, પણ તે વસ્તુઓ ભૌતિક વિશ્વમાં કેવી રીતે અસ્તિત્વમાં છે તે પણ સમજે છે.
OpenAI(ઓપનએઆઈ) સીઈઓ સેમ ઓલ્ટમેને X પર પર્વતની ટોચ પર બે ગોલ્ડન રીટ્રીવર્સનું પોડકાસ્ટિંગ, ગ્નોચી બનાવતી દાદી અને સમુદ્રની ટોચ પર સાયકલ રેસમાં ભાગ લેતા દરિયાઈ પ્રાણીઓના વાસ્તવિક વીડિયો જેવા ‘સોરા'(‘Sora’)ના પરિણામો પોસ્ટ કરતા પહેલા યુઝર્સને સોરા માટે પ્રોમ્પ્ટ્સ સૂચવવા આમંત્રણ આપ્યું હતું. જેમાં જેવા સૂચનો આપવામાં આવ્યા હતા. ‘સોરા'(‘Sora’)ના વિડિયોઝની અતિ-વાસ્તવિક ગુણવત્તાએ સમગ્ર સોશિયલ મીડિયા પર ધૂમ મચાવી દીધી હતી અને ચારેબાજુ ‘સોરા'(‘Sora’)ને લઈને ચર્ચાઓ તેજ બની છે. યુઝર્સ સોરા'(‘Sora’) ના રિઝલ્ટસ્ ને “આઉટ ઓફ ધ વર્લ્ડ” અને “ગેમ ચેન્જર” કહી રહ્યા છે.
સોશિયલ મીડિયા યુઝર્સે સોરા'(‘Sora’)ના ટેક્સ્ટ ટુ વિડીયો પરિણામો પર શું પ્રતિભાવો આપ્યા ?
‘સોરા'(‘Sora’)ના વિડિયોઝ સોશિયલ મીડિયા પર તુરંત જ વાયરલ થયા હતા અને ચારેબાજુ ‘સોરા'(‘Sora’)ને લઈને ચર્ચાઓ તેજ બની છે. યુઝર્સ સોરા'(‘Sora’) ના ટેક્સ્ટ ટુ વિડીયો રિઝલ્ટસ્ને લઈને પોતાના પ્રતિભાવો જુદા જુદા સોશિયલ મીડિયા પ્લેટફોર્મ પર વર્ણવી રહ્યા છે તો કેટલાક યુઝર્સે openai ના પ્લેટફોર્મ પર મુકવામાં આવેલા વિવિધ ટેક્સ્ટ પ્રોમ્પ્ટ આધારિત Sora ના બનાવેલા વિડીયો પણ ચેક કરી રહ્યા છે. X યુઝર્સ દ્વારા OpenAI સોરા દ્વારા જનરેટ કરેલ વિડિયોઝને લઈને કેટલાક સંભવિત જોખમો વિશે ચિંતાઓ પણ વ્યક્ત કરવામાં આવી હતી. ખાસ કરીને નવેમ્બરમાં યુએસ પ્રમુખપદની ચૂંટણી સહિત વિશ્વભરના ઘણા દેશોમાં આ વર્ષમાં આવી રહેલી ચૂંટણીઓમાં આ ફીચર વિવિધ મોરચે અસર કરી શકે છે.
શું કહ્યું OpenAI(ઓપનએઆઈ) એ ‘Sora'(‘સોરા’) ની Security system અને નબળાઈઓને લઈને ?
OpenAI(ઓપનએઆઈ)એ તેના બ્લોગ પોસ્ટમાં વધુમાં જણાવ્યું હતું કે તે ‘સોરા'(‘Sora’)ને સામાન્ય લોકો માટે રિલીઝ કરતા પહેલા સુરક્ષા(Security) આધારિત ઘણા મહત્વપૂર્ણ પગલાં લેશે. તેઓ ગેરમાર્ગે દોરતી સામગ્રીને શોધવામાં મદદ કરવા માટે ડિટેક્શન ક્લાસિફાયર જેવા સાધનો પણ બનાવી રહ્યા છીએ કે જે કહી શકે છે કે ‘સોરા'(‘Sora’) દ્વારા વીડિયો ક્યારે જનરેટ કરવામાં આવ્યો હતો.
તેઓ ખોટી માહિતી, દ્વેષપૂર્ણ સામગ્રી અને પક્ષપાત જેવા ક્ષેત્રોમાં ડોમેન નિષ્ણાત એવા રેડ ટીમર્સ સાથે કામ કરી રહ્યા છે, જેઓ યોગ્ય રીતે મોડેલનું પરીક્ષણ કરશે તેમ કંપનીએ જણાવ્યું હતું.
OpenAI(ઓપનએઆઈ)દ્વારા એ પણ સ્વીકારવામાં આવ્યું કે ‘સોરા'(‘Sora’)માં નબળાઈઓ છે, જેમાં સાતત્યમાં મુશ્કેલી અને ડાબેથી જમણે વચ્ચેનો તફાવત જેવા મુદ્દાઓ સામેલ છે.
OpenAI(ઓપનએઆઈ) સિવાય અન્ય કઈ કંપનીઓ openai sora જેવા ટેક્સ્ટ-ટુ-વિડિયો મોડલ પર કામ કરી રહી છે ?
OpenAI(ઓપનએઆઈ)ના હરીફ મેટા અને ગૂગલે પણ ટેક્સ્ટ-ટુ-વિડિયો AI ટેક્નોલોજીનું નિદર્શન કર્યું છે, પરંતુ તેમના મોડલ્સે ‘સોરા'(‘Sora’) જેટલા વાસ્તવિક પરિણામો આપ્યા નથી.
OpenAI નું નવું ટેક્સ્ટ-ટુ-વિડિયો મોડલ હમણાં માર્કેટમાં ખૂબ જ ચર્ચાઓ જગાવી રહ્યું છે.
OpenAI ‘Sora'(ઓપનએઆઈ ‘સોરા’) વીશે ટેકનીકલ બાબતો અને તેની કામ કારવાની પદ્ધતિ
‘Sora'(‘સોરા’) એ OpenAI દ્વારા વિકસાવાયેલ AI મોડલ છે , જે DALL·E અને GPT મોડલ્સમાં ભૂતકાળના સંશોધન પર બનેલ છે. ‘Sora'(‘સોરા’) મોડલ ટેક્સ્ટ સૂચનાઓના આધારે વિડિયો જનરેટ કરવામાં સક્ષમ છે, અને તેને ગતિશીલ વિડિયો પ્રેઝન્ટેશનમાં રૂપાંતરિત કરીને સ્ટેટિક ઈમેજને એનિમેટ પણ કરી શકે છે. સોરા એક જ વારમાં સંપૂર્ણ વિડિયો બનાવી શકે છે અથવા પહેલાથી બનાવેલા વિડિયોમાં વધુ ઉમેરી શકે છે, જેથી કરીને તેને લાંબો બનાવી શકાય. તે ઉચ્ચ વિઝ્યુઅલ ગુણવત્તા અને સચોટતા સુનિશ્ચિત કરીને એક મિનિટ સુધીના વિડીયો બનાવી શકે છે.
OpenAI(ઓપનએઆઈ)ના જણાવ્યા અનુસાર openai sora વિવિધ પાત્રો, વિગતવાર બેકગ્રાઉન્ડ અને ચોક્કસ ક્રિયાઓ સાથે જટિલ દ્રશ્યો જનરેટ કરી શકે છે. આ મૉડલ માત્ર યુઝર્સની સૂચનાઓને જ સમજતું નથી, પરંતુ તે વાસ્તવિક જીવનની પરિસ્થિતિઓમાં આ તત્વો કેવી રીતે દેખાશે તેનું અર્થઘટન પણ કરી શકે છે. “મૉડલ ભાષાની ઊંડી સમજ ધરાવે છે, જે તેને પ્રોમ્પ્ટનું ચોક્કસ અર્થઘટન કરવામાં અને વાઇબ્રન્ટ લાગણીઓને વ્યક્ત કરતા આકર્ષક પાત્રો જનરેટ કરવા માટે સક્ષમ બનાવે છે. સોરા એક જ જનરેટેડ વિડિયોમાંથી બહુવિધ શૉટ્સ પણ બનાવી શકે છે જે અક્ષરો અને વિઝ્યુઅલ શૈલીને સચોટ રીતે જાળવી રાખે છે.