“Microsoft” cəmi üç saniyəlik nümunə əsasında istənilən şəxsin səsini təqlid edə bilən VALL-E adlı mətni nitqə çevirən neyron şəbəkəsini yaradıb.
Digər insanların səslərinin müxtəlif vəziyyətlərdə necə səsləndiyini bilən neyroşəbəkə eyni situasiyalarda “donorun” nitqinin necə səslənəcəyini təxmin edir. Beləliklə, VALL-E təbii intonasiyalarla nümunə daşıyıcısının səsini çox real şəkildə təqlid edə bilir.
VALL-E-nin yaradılması zamanı EnCodec audio sıxılma texnologiyası və ümumi müddəti təxminən 60 min saat olan 7 mindən çox insanın səs yazıları kitabxanasından istifadə edilib. Hər iki məhsul “Meta” korporasiyasına məxsusdur.
“Microsoft” şirkəti hesab edir ki, yeni neyron şəbəkə mətn əsasında audio məzmunun yaradılması zamanı faydalı olacaq. Xüsusilə, VALL-E tamamilə orijinal məzmun yaratmaq üçün GPT-3 mətn generatoru ilə birlikdə istifadə edilə bilər.
Mənbə: gazeta.ru
“Microsoft” istənilən şəxsin səsini yamsılayan neyron şəbəkə yaradıb
11
yanvar
11:47

Qarabağ
KOMMENTLƏR
- Azərbaycanın daha bir fəxr ediləsi gənc tələbəsi, Selcan Şəfizadəni sizdə tanıyın
- Azərbaycanın daha bir fəxr ediləsi gənc tələbəsi, Selcan Şəfizadəni sizdə tanıyın
- Netanyahu İlham Əliyevi təbrik etdi
- Prezident yol tikintisinə 1,5 milyon manat ayırdı - SƏRƏNCAM
- Fərid Hüseynov: Süni intellektin yıxdığı sənət aləmi aktyorlar, rejissorlar, reklamçılar təhlükədə! SOS
- "Mega Palace", "Bəyaz Saray" və digər restoranlar cərimələndi
- "Trampın Ukrayna münaqişəsi ilə bağlı səbri tükənib"
- Ceyhun Bayramov Keniya Prezidenti ilə GÖRÜŞDÜ
- "Putin, Tramp və Zelenski çətin ki, görüşsün"
- "Elm və təhsillə bağlı strategiyanın hədəflərinə nail olunmayıb" - Deputat