Tech

IIT मद्रास के AI4Bharat ने भारतीय भाषाओं के लिए नया बेंचमार्क टेस्ट लॉन्च किया

November 13, 2025

129

Report by : विनय भट

चेन्नई। भारतीय प्रौद्योगिकी संस्थान (IIT) मद्रास के अनुसंधान केंद्र AI4Bharat ने भारतीय भाषाओं और संदर्भों में काम करने वाले एआई मॉडल्स की क्षमता मापने के लिए एक नया ओपन-सोर्स बेंचमार्क टेस्ट लॉन्च किया है।

गूगल क्लाउड के सहयोग से विकसित यह टेस्ट, Indic LLM-Arena, एक क्राउड-सोर्स्ड प्लेटफ़ॉर्म है जो हजारों अनाम उपयोगकर्ताओं द्वारा दिए गए वोट्स के आधार पर एआई मॉडलों का मूल्यांकन करता है। इन वोट्स के आधार पर मॉडल्स को “ह्यूमन-इन-द-लूप” लीडरबोर्ड पर रैंक किया जाता है।

AI4Bharat के अनुसार, यह प्लेटफ़ॉर्म फिलहाल केवल टेक्स्ट-आधारित इनपुट को सपोर्ट करता है और कई भारतीय भाषाओं के साथ कोड-मिक्स परिदृश्यों — जैसे हिंग्लिश और टैंगलिश — में काम करता है। संस्था का कहना है कि आगे चलकर इस बेंचमार्क को विज़न, ऑडियो और एआई एजेंट्स वाले ओमनी-मॉडल्स तक विस्तारित किया जाएगा।

AI4Bharat के एक शोधकर्ता ने बताया, “हमारा उद्देश्य केवल 22 भाषाओं का अनुवाद करना नहीं है, बल्कि भारतीयों के स्वाभाविक संचार के तरीके को समझना है। भारत में लोग अक्सर एक ही वाक्य में दो या अधिक भाषाओं का प्रयोग करते हैं, और यही एआई के लिए असली चुनौती है।”

इस परियोजना के तहत सभी डेटा, कोड और पाइपलाइन्स को ओपन-सोर्स लाइसेंस के तहत सार्वजनिक किया जाएगा ताकि शोधकर्ता और डेवलपर्स इन्हें और बेहतर बना सकें।

यह पहल ऐसे समय पर आई है जब भारतीय एआई डेवलपर्स लगातार यह मांग कर रहे थे कि स्थानीय भाषाओं के लिए उपयुक्त और निष्पक्ष बेंचमार्क प्लेटफ़ॉर्म उपलब्ध कराया जाए। हाल ही में OpenAI ने भी अपना भारतीय भाषाओं पर केंद्रित टेस्ट IndQA लॉन्च किया था, जिसमें 12 भाषाओं और 10 सांस्कृतिक क्षेत्रों से जुड़े 2,200 से अधिक प्रश्न शामिल हैं।

AI4Bharat का मानना है कि Indic LLM-Arena भारतीय स्टार्टअप्स और शोधकर्ताओं के लिए उपयोगी साबित होगा। इससे उन्हें यह समझने में मदद मिलेगी कि उनके मॉडल भारतीय भाषाओं और संदर्भों में दूसरों की तुलना में कितना बेहतर प्रदर्शन कर रहे हैं।

परीक्षण की प्रक्रिया भी काफी पारदर्शी रखी गई है। उपयोगकर्ता किसी भी भाषा में प्रॉम्प्ट दर्ज करता है, जिसके बाद प्लेटफ़ॉर्म दो अनाम मॉडलों (जैसे Model A और Model B) के उत्तर प्रस्तुत करता है। उपयोगकर्ता तय करता है कि कौन-सा उत्तर बेहतर है या दोनों बराबर हैं। हजारों ऐसे वोट्स के बाद, Bradley-Terry सांख्यिकीय मॉडल के माध्यम से मॉडल्स की रैंकिंग तैयार की जाती है।

AI4Bharat आने वाले महीनों में एक अपडेटेड पब्लिक लीडरबोर्ड जारी करने की योजना बना रहा है, जिसमें सांख्यिकीय अनिश्चितताओं को दूर किया जाएगा। साथ ही, संस्था विभिन्न भाषाओं, विषयों और कार्यों के आधार पर अलग-अलग लीडरबोर्ड पेश करने की भी तैयारी कर रही है।

Hot topics

Finance

Marketing

Politics

Strategy

Hot topics

Finance

Marketing

Politics

Strategy

LEAVE A REPLY Cancel reply

Company

Headlines

Newsletter