Home Tech News Ai AI සමග දියුනු වෙන ලිප්‍ රීඩිං තාක්ශනය
AiExplainedTech News

AI සමග දියුනු වෙන ලිප්‍ රීඩිං තාක්ශනය

Share
blank
Share

බිහිරි අය සමඟ කතාබහ කිරිමට, කට හඬ උපදවිය නොහැකි අය සමඟ කතාබහ කිරීමට යනාදී වැඩ වෙනුවෙන් යොදා ගන්නා ප්‍රකට උපක්‍රමයක් තමයි තොල් සැලෙන රටා කියවීමේ ක්‍රමය. මෙසේ තොල් සැලෙන රටාවට අනුව වචන හඳුනා ගැනීම හෙවත් ලිප් රිඩිං (Lip Reading) ගැන දන්නා ප්‍රවීණයෝ (Lip Readers) ලොව සිටිනව. එහෙත් ඒ අයටත් සියලු දේ නිවැරදිව කියවන්න බැහැ.

ඒ වෘත්තිකයින්ටත් වඩා හොඳින් ලිප් රිඩිං වැඩ කළ හැකි කෘත්‍රිම බුද්ධි පරිගණක පද්ධති තිබෙනව. එවන් පද්ධතියක් තමයි බ්‍රිතාන්‍යයේ ඔක්ස්ෆර්ඩ් විශ්වවිද්‍යාලයේ පර්යේශකයන් පිරිසක් නිපදවල තිබෙන ලිප්නෙට් (LipNet) පද්ධතිය. එය භාවිතා කරන විට 93% ක නිවැරදිතාවෙන් යුතුව මතුලන දේ කියවන්න පුලුවන්. වෘත්තීය මට්ටමේ තොල් කියවන්නන් පවා 60%ක නිවැරදිබවකින් ඔබ්බට යන්නේ කලාතුරකින් නිසා, මෙය විශිෂ්ට තත්වයක්.

ඔක්ස්ෆර්ඩ් විශ්වවිද්‍යාලය සිය ක්‍රමවේදය දියුණු කරනු වස් තත්පර තුනක පමණ කාලයක් තුළ දිවෙන වීඩියෝ 29000ක් යෙදාගෙන තිබෙනව. ඒවා සියල්ල බීබීසී පුවත් සේවයෙන් ලබාගෙන තිබෙන්නෙ උපසිරැසිද සහිතවයි. ඉන්පසුව ගූගල් සමාගමේ කෘත්‍රිම බුද්ධි ආයතනය වෙන ඩීප්මයින්ඩ් (DeepMind) හි උපකාරයෙන් තොල් සැලෙන රටාව හඳුනා ගැනීමට හැකි කෘත්‍රිම බුද්ධි පරිගණක ගණනය කිරීමේ උපක්‍රමයක් හෙවත් ඇල්ගොරිදමයක් (algorithm) සකසා තිබෙනව. එතැන් සිට වීඩියෝ කියවමින්, වචන දත්ත ගබඩාවක් සකසා, ලිට්නෙට් පද්ධතිය නිර්මානය කර තිබෙනව.

දැන් මෙය භාවිතා වෙන්නේ ඉංග්‍රීසියෙන්. එහෙත් ඕනෑම භාෂාවකින් කතා කරන අයගේ තොල් සැලෙන රටාව හඳුනා ගන්නට මෙම තාක්ෂණික යෙදුම භාවිතා කරන්නට පුළුවන්. කලින් නොතිබූ මෙම අලුත් ලිප්රීඩිං තාක්ෂණය ප්‍රයෝජන වනසේ යොදා ගත හැකි අවස්ථා ගණනාවක් තිබෙනව. කන් ඇසෙන්නේ නැති අය සමඟ අදහස් හුවමාරු කරගන්නට එය යොදා ගත හැකිවීම මූලික සහ මහත්ඵල දෙන අවස්තාවක්.

මහජනයා ගැවසෙන තැනක සිට කට හඬ නොනඟා රහසේ කතා කරමින් ස්මාට්ෆෝන් භාවිතා කිරීමට හැකි ඇප් තනන්නට මෙම තාක්ෂණය යොදාගන්න පුලුවන්. වටපිටාවේ ඝෝෂාව, කට හඬට වඩා උස්වූ විට දුරකතනයකින් කතා කරන හඬ අනෙක් කෙළවර සිටින්නාට ඇසෙන්නැ. එවිට තොල් සැලෙන රටාව හඳුනා ගන්නා ස්මාට්ෆෝන් ඇප් එකට කතාව වචනයට හරවා අනෙක් කෙළවරේ සිටින්නාට දන්වන්නට පුළුවන්.

එසේම ඇඟිලි සළකුණ, ඇසේ කණිනිකාව හඳුනාගැනීම, කට හඬ හඳුනාගැනීම වැනි ජීවමිතිය හඳුනා ගැනීමේ ක්‍රමයක් (bio-metric identification) වශයෙන්ද තොල් සැලෙන රටාව කියවීම භාවිතා කරන්නට පුළුවන්.

එසේ වුවත් මෙම තාක්ෂණයේ මඟහැර යා නොහැකි දුෂ්කර තැන්ද තිබෙනව. සෑම භාෂාවකම තිබෙන හඬ වෙනස්වුවත්, එක සේ තොල් සොලවා කියවන වචන හඳුනා ගත නොහැකිවීම එම දෝෂයයි. ඉංග්‍රීසි භාෂාවේ එන Mat (මැට්) Bat (බැට්) Pat (පැට්) යන වචන තුන නිදසුනක් සේ ගෙන හැර දක්වන්න පුලුවන්. ඒවායේ හඬ වෙනස්වුවත් තොල් සලා උච්චාරණය කරන්නේ එකම විදියටයි.

දැන් මෙවැනි තැන් දියුණු කරන්නට පර්යේෂකයෝ උපා සොයමින් සිටිනව. භාවිතා කරන උපක්‍රමයක් වන්නේ, වචන උච්ඡාරණයත් සමඟ වාක්‍යයක්ම අවබෝධකර ගත හැකි සේ සිය ඇල්ගොරිදමය දියුණු කිරිමයි. ඒ සඳහා ගූගල් සමාගමේ සහය ලබා ගැනෙනව. ගූගල් සර්ච් එන්ජ්මේදී වචනයක් සෙවූ විට එය යෙදී ඇති වාක්‍යයද පෙන්වනව. මේ අයුරින් ලිප්නෙට් ජාලයේදී භාවිතා කෙරෙන වචන සමඟ වාක්‍ය දත්තද එක් කිරීමද මේ වනවිට සිදුකර තිබෙනව. එවිට වචනය වාක්‍යයක යෙදී ඇති ස්වරූපය දැන, නොමනා වචන මඟහැර, ගැළපෙන වචනය දැන ගන්නව.

Share
Written by
Pramuka Ramanayake

Technology is anything that wasn't around when you were born.

Leave a comment

Leave a Reply

Related Articles

2026ට MSI සමාගමෙන් ගේන අලුත්ම උපාංග

Gaming වලින් සහ high-performance AI computing ලෝකයේ ප්‍රධාන නාමයක් වන MSI, 2026...

MSI සමාගමෙන් එන අලුත්ම gaming monitors

MSI සමාගම ඔවුන්ගේ අලුත්ම 32-inch 4K QD-OLED gaming monitor lineup එකට අලුතෙන්...

MSI සමාගමෙන් හදුන්වාදෙන නවතම PRO Max Series එක

2026 ජනවාරි 6 වෙනිදා MSI සමාගම නව PRO MAX Series එක හඳුන්වා...

යකෙක් වගෙ වැඩ ගන්න නවතම GeForce RTX™ 5090 32G LIGHTNING Z

Gaming වල real performance එක experience කරන්න නම් හොදම GPU එකක් තියෙන...