Душанбе, 7 шілде, — «Караван Инфо» АА.Тәжікстан тарихында алғаш рет тәжік тілін толық түсінетін және өңдейтін жасанды интеллект – SoroLLM моделі жасалды.
SoroLLM — көптеген диалектілер мен аймақтық ерекшеліктерін ескере отырып, тәжік тілінде сөйлеуге арнайы дайындалған алғашқы нейрондық желі. Жобаны тәжік тіліне тән бірегей синтаксисті, сирек лексиканы және әртүрлі айтылу нұсқаларын ескеруге тырысатын zehnlab.ai зерттеушілері тобы әзірледі.

25 маусымда модель елдегі бірінші Жасанды интеллект есептеу ресурстық орталығының ашылуында президент Эмомали Рахмонға ресми түрде ұсынылды. Бұл оқиға Тәжікстанның цифрлық дамуындағы маңызды қадам болды және жергілікті технологиялардың маңыздылығын көрсетті.
SoroLLM-ге дейін тәжік тілі GPT немесе LLaMA сияқты негізгі жаһандық тіл үлгілерінде іс жүзінде көрсетілмеген. Олардан айырмашылығы, SoroLLM арнайы тәжік тілінің ерекшелігіне бейімделген — солтүстік диалектілерден памир диалектілеріне дейін.
«Біз үшін модель тәжік тілін танып қана қоймай, оның барлық алуан түрлілігін қамтуы маңызды», — дейді әзірлеушілер.
Жоба белсенді даму кезеңінде: жақын арада жоспарлар мәтінмен ғана емес, аудио және бейне деректермен де жұмыс істеуге мүмкіндік беретін мультимодальды функцияларды біріктіруді қамтиды.
Команда елдің барлық тұрғындарын модельді жетілдіруге қатысуға шақырады — ол үшін диалектіңіз туралы айтып, қысқа Google формасын толтыру жеткілікті.
ФОТО: ашық көздерден
Бұл мақала жасанды интеллект көмегімен аударылған