Press ESC to close

AI සමග දියුනු වෙන ලිප්‍ රීඩිං තාක්ශනය

බිහිරි අය සමඟ කතාබහ කිරිමට, කට හඬ උපදවිය නොහැකි අය සමඟ කතාබහ කිරීමට යනාදී වැඩ වෙනුවෙන් යොදා ගන්නා ප්‍රකට උපක්‍රමයක් තමයි තොල් සැලෙන රටා කියවීමේ ක්‍රමය. මෙසේ තොල් සැලෙන රටාවට අනුව වචන හඳුනා ගැනීම හෙවත් ලිප් රිඩිං (Lip Reading) ගැන දන්නා ප්‍රවීණයෝ (Lip Readers) ලොව සිටිනව. එහෙත් ඒ අයටත් සියලු දේ නිවැරදිව කියවන්න බැහැ.

ඒ වෘත්තිකයින්ටත් වඩා හොඳින් ලිප් රිඩිං වැඩ කළ හැකි කෘත්‍රිම බුද්ධි පරිගණක පද්ධති තිබෙනව. එවන් පද්ධතියක් තමයි බ්‍රිතාන්‍යයේ ඔක්ස්ෆර්ඩ් විශ්වවිද්‍යාලයේ පර්යේශකයන් පිරිසක් නිපදවල තිබෙන ලිප්නෙට් (LipNet) පද්ධතිය. එය භාවිතා කරන විට 93% ක නිවැරදිතාවෙන් යුතුව මතුලන දේ කියවන්න පුලුවන්. වෘත්තීය මට්ටමේ තොල් කියවන්නන් පවා 60%ක නිවැරදිබවකින් ඔබ්බට යන්නේ කලාතුරකින් නිසා, මෙය විශිෂ්ට තත්වයක්.

Get Your Site Up with A2 Hosting

ඔක්ස්ෆර්ඩ් විශ්වවිද්‍යාලය සිය ක්‍රමවේදය දියුණු කරනු වස් තත්පර තුනක පමණ කාලයක් තුළ දිවෙන වීඩියෝ 29000ක් යෙදාගෙන තිබෙනව. ඒවා සියල්ල බීබීසී පුවත් සේවයෙන් ලබාගෙන තිබෙන්නෙ උපසිරැසිද සහිතවයි. ඉන්පසුව ගූගල් සමාගමේ කෘත්‍රිම බුද්ධි ආයතනය වෙන ඩීප්මයින්ඩ් (DeepMind) හි උපකාරයෙන් තොල් සැලෙන රටාව හඳුනා ගැනීමට හැකි කෘත්‍රිම බුද්ධි පරිගණක ගණනය කිරීමේ උපක්‍රමයක් හෙවත් ඇල්ගොරිදමයක් (algorithm) සකසා තිබෙනව. එතැන් සිට වීඩියෝ කියවමින්, වචන දත්ත ගබඩාවක් සකසා, ලිට්නෙට් පද්ධතිය නිර්මානය කර තිබෙනව.

දැන් මෙය භාවිතා වෙන්නේ ඉංග්‍රීසියෙන්. එහෙත් ඕනෑම භාෂාවකින් කතා කරන අයගේ තොල් සැලෙන රටාව හඳුනා ගන්නට මෙම තාක්ෂණික යෙදුම භාවිතා කරන්නට පුළුවන්. කලින් නොතිබූ මෙම අලුත් ලිප්රීඩිං තාක්ෂණය ප්‍රයෝජන වනසේ යොදා ගත හැකි අවස්ථා ගණනාවක් තිබෙනව. කන් ඇසෙන්නේ නැති අය සමඟ අදහස් හුවමාරු කරගන්නට එය යොදා ගත හැකිවීම මූලික සහ මහත්ඵල දෙන අවස්තාවක්.

මහජනයා ගැවසෙන තැනක සිට කට හඬ නොනඟා රහසේ කතා කරමින් ස්මාට්ෆෝන් භාවිතා කිරීමට හැකි ඇප් තනන්නට මෙම තාක්ෂණය යොදාගන්න පුලුවන්. වටපිටාවේ ඝෝෂාව, කට හඬට වඩා උස්වූ විට දුරකතනයකින් කතා කරන හඬ අනෙක් කෙළවර සිටින්නාට ඇසෙන්නැ. එවිට තොල් සැලෙන රටාව හඳුනා ගන්නා ස්මාට්ෆෝන් ඇප් එකට කතාව වචනයට හරවා අනෙක් කෙළවරේ සිටින්නාට දන්වන්නට පුළුවන්.

එසේම ඇඟිලි සළකුණ, ඇසේ කණිනිකාව හඳුනාගැනීම, කට හඬ හඳුනාගැනීම වැනි ජීවමිතිය හඳුනා ගැනීමේ ක්‍රමයක් (bio-metric identification) වශයෙන්ද තොල් සැලෙන රටාව කියවීම භාවිතා කරන්නට පුළුවන්.

එසේ වුවත් මෙම තාක්ෂණයේ මඟහැර යා නොහැකි දුෂ්කර තැන්ද තිබෙනව. සෑම භාෂාවකම තිබෙන හඬ වෙනස්වුවත්, එක සේ තොල් සොලවා කියවන වචන හඳුනා ගත නොහැකිවීම එම දෝෂයයි. ඉංග්‍රීසි භාෂාවේ එන Mat (මැට්) Bat (බැට්) Pat (පැට්) යන වචන තුන නිදසුනක් සේ ගෙන හැර දක්වන්න පුලුවන්. ඒවායේ හඬ වෙනස්වුවත් තොල් සලා උච්චාරණය කරන්නේ එකම විදියටයි.

දැන් මෙවැනි තැන් දියුණු කරන්නට පර්යේෂකයෝ උපා සොයමින් සිටිනව. භාවිතා කරන උපක්‍රමයක් වන්නේ, වචන උච්ඡාරණයත් සමඟ වාක්‍යයක්ම අවබෝධකර ගත හැකි සේ සිය ඇල්ගොරිදමය දියුණු කිරිමයි. ඒ සඳහා ගූගල් සමාගමේ සහය ලබා ගැනෙනව. ගූගල් සර්ච් එන්ජ්මේදී වචනයක් සෙවූ විට එය යෙදී ඇති වාක්‍යයද පෙන්වනව. මේ අයුරින් ලිප්නෙට් ජාලයේදී භාවිතා කෙරෙන වචන සමඟ වාක්‍ය දත්තද එක් කිරීමද මේ වනවිට සිදුකර තිබෙනව. එවිට වචනය වාක්‍යයක යෙදී ඇති ස්වරූපය දැන, නොමනා වචන මඟහැර, ගැළපෙන වචනය දැන ගන්නව.

Leave a Reply

Your email address will not be published. Required fields are marked *