ОпенАИ-јевом АИ моделу за репродукцију звука потребан је само узорак од 15 секунди да би функционисао

ОпенАИ нуди ограничен приступ платформи за претварање текста у глас коју је развио под називом Воице Енгине, која може да креира синтетички глас на основу 15-секундног снимка нечијег гласа. Глас генерисан вештачком интелигенцијом може да чита текстуалне упите на захтев на истом језику као и говорник или на бројним другим језицима. „Ове мале примене помажу у информисању нашег приступа, заштите и размишљања о томе како се Воице Енгине може користити за веће добро у свим индустријама“, ОпенАИ рекао је у свом блог посту.

Компаније са приступом укључују едтецх компанију Аге оф Леарнинг, платформу за визуелно приповедање ХеиГен, произвођача здравственог софтвера на првој линији Димаги, креатора апликација за комуникацију са вештачком интелигенцијом Ливок и здравствени систем Лифеспан.

У овим узорцима које је објавио ОпенАИ, можете чути шта… Ера учења Технологија је изманипулисана за креирање унапред написаног аудио садржаја, као и за читање „личних одговора у реалном времену“ ученика које је написао ГПТ-4.

Прво: Референтни аудио на енглеском:

Ево три аудио клипа генерисана вештачком интелигенцијом на основу тог узорка:

ОпенАИ је рекао да је почео да развија Воице Енгине крајем 2022. године и да је технологија већ покренула унапред направљене гласове за АПИ за претварање текста у говор и функцију читања наглас у ЦхатГПТ-у. У интервјуу са ТецхЦрунцхМодел је обучен на „комбинацији лиценцираних и јавно доступних података“, рекао је Џеф Харис, члан ОпенАИ производног тима за Воице Енгине. ОпенАИ је рекао публикацији да ће модел бити доступан само за око 10 програмера.

Генерисање конверзије текста у говор помоћу вештачке интелигенције је област генеративне вештачке интелигенције која наставља да се развија. Док се већина фокусира на звукове инструмената или природне звукове, мањи број се фокусирао на генерисање звука, делимично због питања која цитира ОпенАИ. Нека имена у овом простору укључују компаније као што су Подцастле и ЕлевенЛабс, које пружају технологију и алате за клонирање АИ звука вертцаст Истражите прошле године.

READ Комисија за хартије од вредности истражује тржиште НФТ ради могућих кршења хартија од вредности: извештаји

Према ОпенАИ-ју, његови партнери су пристали да се придржавају његових политика коришћења у којима се наводи да неће користити генерисање гласа за лажно представљање људи или организација без њиховог пристанка. Такође захтева од партнера да добију „изричит и информисани пристанак“ од изворног говорника, а не да граде начине за појединачне кориснике да креирају сопствене гласове и да открију слушаоцима да гласове генерише вештачка интелигенција. ОпенАИ је такође додао водени жиг аудио клиповима како би пратио њихово порекло и пратио како се аудио ефикасно користи.

ОпенАИ је предложио неколико корака за које верује да би могли да ограниче ризике везане за алатке попут ових, укључујући постепено укидање аутентификације засноване на гласу за приступ банковним рачунима, политике за заштиту употребе гласова људи у АИ и повећање образовања о АИ деепфакес и развој система за праћење. За садржај вештачке интелигенције.

Milica Pavlović

„Љубитељ пива. Предан научник поп културе. Нинџа кафе. Зли љубитељ зомбија. Организатор.“

ОпенАИ-јевом АИ моделу за репродукцију звука потребан је само узорак од 15 секунди да би функционисао

Србија и преговори о НИС-у: Савић верује да држава и даље има јаку преговарачку позицију

Копије решења о порезу на имовину доступне су у поштама широм Београда

Енергетски микс у доба кризе: Србија између базних капацитета и зелене енергије

Научници из Кембриџа развили су прву вакцину направљену помоћу вештачке интелигенције

Епл најављује нови Сири, iOS 27 и први телефон на преклапање

Српска чоколада осваја страна тржишта: Извоз премашио 220 милиона евра

Акара Г350 комбинује безбедност и управљање паметним домом у једном уређају

Оставите одговор Одустани од одговора

More Stories