Home Tech News Ai AI සමග දියුනු වෙන ලිප්‍ රීඩිං තාක්ශනය
AiExplainedTech News

AI සමග දියුනු වෙන ලිප්‍ රීඩිං තාක්ශනය

Share
blank
Share

බිහිරි අය සමඟ කතාබහ කිරිමට, කට හඬ උපදවිය නොහැකි අය සමඟ කතාබහ කිරීමට යනාදී වැඩ වෙනුවෙන් යොදා ගන්නා ප්‍රකට උපක්‍රමයක් තමයි තොල් සැලෙන රටා කියවීමේ ක්‍රමය. මෙසේ තොල් සැලෙන රටාවට අනුව වචන හඳුනා ගැනීම හෙවත් ලිප් රිඩිං (Lip Reading) ගැන දන්නා ප්‍රවීණයෝ (Lip Readers) ලොව සිටිනව. එහෙත් ඒ අයටත් සියලු දේ නිවැරදිව කියවන්න බැහැ.

ඒ වෘත්තිකයින්ටත් වඩා හොඳින් ලිප් රිඩිං වැඩ කළ හැකි කෘත්‍රිම බුද්ධි පරිගණක පද්ධති තිබෙනව. එවන් පද්ධතියක් තමයි බ්‍රිතාන්‍යයේ ඔක්ස්ෆර්ඩ් විශ්වවිද්‍යාලයේ පර්යේශකයන් පිරිසක් නිපදවල තිබෙන ලිප්නෙට් (LipNet) පද්ධතිය. එය භාවිතා කරන විට 93% ක නිවැරදිතාවෙන් යුතුව මතුලන දේ කියවන්න පුලුවන්. වෘත්තීය මට්ටමේ තොල් කියවන්නන් පවා 60%ක නිවැරදිබවකින් ඔබ්බට යන්නේ කලාතුරකින් නිසා, මෙය විශිෂ්ට තත්වයක්.

ඔක්ස්ෆර්ඩ් විශ්වවිද්‍යාලය සිය ක්‍රමවේදය දියුණු කරනු වස් තත්පර තුනක පමණ කාලයක් තුළ දිවෙන වීඩියෝ 29000ක් යෙදාගෙන තිබෙනව. ඒවා සියල්ල බීබීසී පුවත් සේවයෙන් ලබාගෙන තිබෙන්නෙ උපසිරැසිද සහිතවයි. ඉන්පසුව ගූගල් සමාගමේ කෘත්‍රිම බුද්ධි ආයතනය වෙන ඩීප්මයින්ඩ් (DeepMind) හි උපකාරයෙන් තොල් සැලෙන රටාව හඳුනා ගැනීමට හැකි කෘත්‍රිම බුද්ධි පරිගණක ගණනය කිරීමේ උපක්‍රමයක් හෙවත් ඇල්ගොරිදමයක් (algorithm) සකසා තිබෙනව. එතැන් සිට වීඩියෝ කියවමින්, වචන දත්ත ගබඩාවක් සකසා, ලිට්නෙට් පද්ධතිය නිර්මානය කර තිබෙනව.

දැන් මෙය භාවිතා වෙන්නේ ඉංග්‍රීසියෙන්. එහෙත් ඕනෑම භාෂාවකින් කතා කරන අයගේ තොල් සැලෙන රටාව හඳුනා ගන්නට මෙම තාක්ෂණික යෙදුම භාවිතා කරන්නට පුළුවන්. කලින් නොතිබූ මෙම අලුත් ලිප්රීඩිං තාක්ෂණය ප්‍රයෝජන වනසේ යොදා ගත හැකි අවස්ථා ගණනාවක් තිබෙනව. කන් ඇසෙන්නේ නැති අය සමඟ අදහස් හුවමාරු කරගන්නට එය යොදා ගත හැකිවීම මූලික සහ මහත්ඵල දෙන අවස්තාවක්.

මහජනයා ගැවසෙන තැනක සිට කට හඬ නොනඟා රහසේ කතා කරමින් ස්මාට්ෆෝන් භාවිතා කිරීමට හැකි ඇප් තනන්නට මෙම තාක්ෂණය යොදාගන්න පුලුවන්. වටපිටාවේ ඝෝෂාව, කට හඬට වඩා උස්වූ විට දුරකතනයකින් කතා කරන හඬ අනෙක් කෙළවර සිටින්නාට ඇසෙන්නැ. එවිට තොල් සැලෙන රටාව හඳුනා ගන්නා ස්මාට්ෆෝන් ඇප් එකට කතාව වචනයට හරවා අනෙක් කෙළවරේ සිටින්නාට දන්වන්නට පුළුවන්.

එසේම ඇඟිලි සළකුණ, ඇසේ කණිනිකාව හඳුනාගැනීම, කට හඬ හඳුනාගැනීම වැනි ජීවමිතිය හඳුනා ගැනීමේ ක්‍රමයක් (bio-metric identification) වශයෙන්ද තොල් සැලෙන රටාව කියවීම භාවිතා කරන්නට පුළුවන්.

එසේ වුවත් මෙම තාක්ෂණයේ මඟහැර යා නොහැකි දුෂ්කර තැන්ද තිබෙනව. සෑම භාෂාවකම තිබෙන හඬ වෙනස්වුවත්, එක සේ තොල් සොලවා කියවන වචන හඳුනා ගත නොහැකිවීම එම දෝෂයයි. ඉංග්‍රීසි භාෂාවේ එන Mat (මැට්) Bat (බැට්) Pat (පැට්) යන වචන තුන නිදසුනක් සේ ගෙන හැර දක්වන්න පුලුවන්. ඒවායේ හඬ වෙනස්වුවත් තොල් සලා උච්චාරණය කරන්නේ එකම විදියටයි.

දැන් මෙවැනි තැන් දියුණු කරන්නට පර්යේෂකයෝ උපා සොයමින් සිටිනව. භාවිතා කරන උපක්‍රමයක් වන්නේ, වචන උච්ඡාරණයත් සමඟ වාක්‍යයක්ම අවබෝධකර ගත හැකි සේ සිය ඇල්ගොරිදමය දියුණු කිරිමයි. ඒ සඳහා ගූගල් සමාගමේ සහය ලබා ගැනෙනව. ගූගල් සර්ච් එන්ජ්මේදී වචනයක් සෙවූ විට එය යෙදී ඇති වාක්‍යයද පෙන්වනව. මේ අයුරින් ලිප්නෙට් ජාලයේදී භාවිතා කෙරෙන වචන සමඟ වාක්‍ය දත්තද එක් කිරීමද මේ වනවිට සිදුකර තිබෙනව. එවිට වචනය වාක්‍යයක යෙදී ඇති ස්වරූපය දැන, නොමනා වචන මඟහැර, ගැළපෙන වචනය දැන ගන්නව.

Share
Written by
Pramuka Ramanayake

Technology is anything that wasn't around when you were born.

Leave a comment

Leave a Reply

Related Articles

අලුතෙන් ආපු ChatGPT Atlas AI Browser එක

OpenAI සමාගම විසින් පසුගියදා ChatGPT Atlas නමින් AI-powered web browser එකක් නිකුත්...

නවතම Galaxy XR Headset එක ගැන දැනගමු

Samsung සමාගම විසින් ඔවුන්ගේ නවතම Galaxy XR headset එක එලි දැක්වුවා. දැනටමත්...

Windows 10 ඇත්තටම ඉවරද, ඊලගට මොකද කරන්නෙ…?

ලොව පුරා මිලියන ගණනක් පරිශීලකයන් විසින් භාවිතා කරන ලද Windows 10 මෙහෙයුම්...

ලොව පළමු Robot Smartphone එක Honor වෙතින්

ජංගම දුරකථන ඉතිහාසයේ නව හැරවුම් ලක්ෂයක් එක් කරමින් Honor සමාගම නවතම සංකල්පයක්...