Homeవిశ్లేషణకృత్రిమ మేధస్సులో తెలుగు స్థానం

కృత్రిమ మేధస్సులో తెలుగు స్థానం

- Advertisement -

విజయ్ కుమార్ కుర్రా

కృత్రిమ మేధస్సు అనగానే మనకు వెంటనే గుర్తొచ్చేది ఇంగ్లీష్ మాట్లాడే యంత్రాలు, ఆంగ్లంలో కోడ్ రాసే అల్గోరిథమ్‌లు, చాట్‌బాట్లు. ఈ దశలో మనకు సహజంగా కలిగే ప్రశ్న “తెలుగు భాషకి ఇందులో స్థానం ఉందా ? లేదా ఏఐకి తెలుగు అర్థమవుతుందా ?” అనే అంశం కదా. భాష అనేది కేవలం మాటల సమాహారం కానే కాదు. అది భావావేశం, సంస్కృతి, అనుబంధం. తెలుగు మాట్లాడే కోట్ల మంది ప్రజలు ఉన్నప్పటికీ, ఏఐ ప్రపంచంలో మన భాషకి సరైన స్థానం దక్కిందా అన్నది చర్చించాల్సిన విషయం. ప్రస్తుతం వాడుతున్న చాట్‌బాట్లు, వాయిస్ అసిస్టెంట్లు, ట్రాన్స్‌లేషన్ టూల్స్ వంటి వాటిల్లో తెలుగు భాషా పరిధి చాలా పరిమితంగా ఉంటుంది. ఉదాహరణకు, గూగుల్ ట్రాన్స్‌లేట్ అనే టూల్ తెలుగులో అనువాదం చేయగలుగుతున్నా అది సహజంగా మాట్లాడే అర్థంలో కాకుండా ట్రూ టాన్స్‌లేషన్ చేయడం వలన దాని అర్థం మొత్తం మారిపోతోంది. సారాంశాన్ని చెప్పే సామర్థ్యం కంటే, భావం గుర్తించే సున్నితత్వం ఈ టూల్‌లో తక్కువగా ఉంటుంది. ఇది నేచురల్ లాంగ్వేజ్ ప్రాసెసింగ్‌లో స్థానిక భాషల పరిమితి ఉండడం కారణంగా భాషను అర్థం చేసుకోవడం ఏఐకి చాలా క్లిష్టమైన పని. ఎందుకంటే, భాష కేవలం అక్షరాలు, పదాల కలయిక కాదు. అది భావోద్వేగాల సమాహారం. తెలుగు వంటి ధ్వనిభరిత, వ్యాకరణ ఆధారిత, శైలీ సమృద్ధి గల భాషలకి డేటా లభ్యత తక్కువగా ఉంటుంది. మెషిన్ లెర్నింగ్ మోడల్స్ ఐతే అవి పాఠాలను చదివి నేర్చుకుంటాయి. కానీ తెలుగు డేటా (పుస్తకాలు, సంభాషణలు, సబ్‌టైటిల్స్, వార్తలు) డిజిటలైజ్ చేసి శుద్ధంగా, వరల్డ్-రెడీ డేటాబేస్‌లుగా తయారుచేయాల్సిన అవసరం ఉంది. ఇక్కడే ప్రభుత్వ, విద్యా, పరిశోధనా సంస్థల బాధ్యత మొదలవుతుంది. 2020లో కేంద్ర ప్రభుత్వం ప్రారంభించిన భాషిణి ప్రాజెక్ట్ ఇందుకు మొదటి మెట్టుగా చెప్పవచ్చు. దీని లక్ష్యం భారతదేశంలోని అన్ని భాషలను డిజిటల్ యుగంలోకి తీసుకురావడం. ఈ ప్రాజెక్ట్ కింద వాయిస్ డేటా, పాఠ్య డేటా, అనువాద డేటా సంకలనం జరుగుతోంది. ఇందులో తెలుగు భాగస్వామ్యం పెరగాల్సిన అవసరం ఎంతో ఉంది. తెలుగు ఎనఎల్‌పి అభివృద్ధికి ఐఐటీ మద్రాస్, ఐఐటీ హైదరాబాద్ వంటి సంస్థలు కృషి చేస్తుండగా, ఇతర ప్రైవేటు సంస్థలు మాత్రం దీనిపై పెద్దగా దృష్టి పెట్టలేదు. కారణం వాణిజ్యపరంగా తెలుగు డేటా తక్కువగా ఉండడం. ఈ దశలో భాషాపరమైన చైతన్యం అత్యవసరం.
తెలుగు ఏఐ మోడల్స్ అభివృద్ధి చేయాలంటే పెద్ద మొత్తంలో శుద్ధమైన డేటా కావాలి. భాషా నిపుణులు, టెక్నికల్ అభివృద్ధికర్తల మధ్య భాగస్వామ్యం ఉండాలి. ప్రభుత్వ మద్దతుతో భాషా డేటా మార్కెట్‌కు ప్రోత్సాహం కల్పించాలి. తెలుగు టెక్ కమ్యూనిటీలు, వాలంటీర్ మోడల్స్ ద్వారా డేటా సేకరణ జరగాలి. తెలుగు భాషలో ఏఐ పని చేయాలంటే, అది మాటలను గుర్తించాలి, భావాలను అర్థం చేసుకోవాలి, పునరుత్పత్తి చేయగలగాలి. ఇందుకోసం డీప్ లెర్నింగ్ మోడల్స్‌ని తెలుగు భాషపై ప్రత్యేకంగా శిక్షణ ఇవ్వాలి. ఇందుకు కావాల్సింది భాషా డేటా. అది కూడా నాణ్యమైనది. వారు, మీరు, నువ్వు, మీరు, వాడు, ఆవిడ వంటి సున్నితమైన భావ వ్యత్యాసాలను గుర్తించగల ఏఐ తయారుచేయాలంటే భాషపై పట్టు, ప్రజలపై గౌరవం అవసరం. ఇప్పుడు ఏఐ కొన్ని అసందర్భ పదాలు అనువాదం చేస్తుంది.
ఉదాహరణకు ఆంగ్లంలో “అండ”కు బదులు తెలుగులో లేని పదం “మరియు” ఇస్తుంది. ఇలాంటివే కొన్ని పదాలు ఇబ్బందికరంగా ఉన్నాయి. ముఖ్యంగా, వాయిస్ ఆధారిత ఏఐ టూల్స్‌లో తెలుగు వాడకం పెరగడం కొద్దిగా సానుకూల సంకేతం. అలెక్సా, గూగుల్ అసిస్టెంట్, సిరి వంటి వాటిలో తెలుగు సమర్థత కొంతమేర మెరుగవుతోంది. కానీ ఇవి ఇంకా పూర్తిస్థాయిలో సహజ సంభాషణ చేయలేవు. అనేక సందర్భాల్లో యాక్సెంట్ గుర్తింపు సమస్యలు, భావం సరిగా అర్థం కానివి జరుగుతూనే ఉన్నాయి. తెలుగు భాషాభిమానులు, సాంకేతికవేత్తలు కలిసి పని చేస్తే భవిష్యత్తులో మన భాషలోనే మాట్లాడగల ఏఐను రూపొందించవచ్చు. పిల్లల విద్య, రైతుల సమాచారం, పెద్దల ఆరోగ్యం వంటి అన్ని రంగాల్లో ఏఐని తెలుగు తాత్వికత, తెలుగు భావవ్యాప్తితో ఉపయోగించవచ్చు. ఇది కేవలం సాంకేతిక అవసరం కాదు సాంస్కృతిక కర్తవ్యమూ కాదా? తెలుగుభాష తరతరాలుగా జీవించి ఉండేలా చేయాలంటే, ఏఐలో తెలుగుకు ప్రత్యేక చోటు కల్పించాల్సిందే.
ఏఐ జర్నలిస్ట్, తెలుగు ఏఐ ట్రైనర్
సెల్ : 99496 90009

RELATED ARTICLES
- Advertisment -spot_img
-Advertisement-

తాజా వార్తలు