சர்வம் AI: கூகுள் ஜெமினி & சாட்ஜிபிடியை இந்தியா-குறிப்பிட்ட AI பணிகளில் மிஞ்சிய இந்திய ஸ்டார்ட்அப்
பெங்களூருவைச் சேர்ந்த சர்வம் AI (Sarvam AI) என்ற இந்திய AI ஸ்டார்ட்அப், சமீபத்தில் உலக அளவில் பெரும் கவனத்தை ஈர்த்துள்ளது. காரணம்? அதன் Sarvam Vision மாடல், கூகுள் ஜெமினி (Gemini) மற்றும் OpenAI-யின் ChatGPT போன்ற உலகின் முன்னணி AIகளை இந்தியா-குறிப்பிட்ட பணிகளில் (குறிப்பாக ஆவண OCR மற்றும் இந்திய மொழிகள்) மிஞ்சியுள்ளது என்று அறிவித்துள்ளது!
இந்த செய்தி Times of India கட்டுரையில் (பிப்ரவரி 2026) வெளியானது. இதைப் பற்றி தமிழில் விரிவாகப் பார்ப்போம்.
சர்வம் AI என்றால் என்ன?
சர்வம் AI என்பது 2023-ல் தொடங்கப்பட்ட இந்தியாவின் Sovereign AI (தன்னாட்சி AI) முயற்சியின் முக்கிய பகுதி. இது இந்தியாவின் 22 அட்டவணை மொழிகளுக்கு (தமிழ் உட்பட) ஏற்ற AI மாடல்களை உருவாக்குவதில் கவனம் செலுத்துகிறது.
முக்கிய மாடல்கள்:
- Sarvam Vision – 3 பில்லியன் பாராமீட்டர் கொண்ட விஷன்-லாங்குவேஜ் மாடல் (படங்கள் + உரை புரிதல்).
- Bulbul V3 – குரல் (Text-to-Speech) மாடல், 11+ இந்திய மொழிகளில் 35+ குரல்கள்.
இவை ஆவண உளவியல் (Document Intelligence), OCR (Optical Character Recognition), சிக்கலான ஸ்கேன்ட் ஆவணங்கள், கையெழுத்து, வரலாற்று உரைகள், நிதி ஆவணங்கள் போன்றவற்றை இந்திய மொழிகளில் சிறப்பாக கையாள்கின்றன.
எங்கே மிஞ்சியது? பெஞ்ச்மார்க் முடிவுகள்
சர்வம் AI தனது மாடல்கள் உலகளாவிய பெஞ்ச்மார்க்குகளில் சிறப்பாக செயல்பட்டதாக கூறுகிறது – குறிப்பாக இந்தியா-குறிப்பிட்ட பணிகளில்:
- olmOCR-Bench (உலகளாவிய OCR சோதனை): 84.3% துல்லியம் – Gemini 3 Pro (80.2%), DeepSeek OCR v2-ஐ விட அதிகம். ChatGPT இதில் பின்தங்கியது (~69.8%).
- OmniDocBench v1.5 (சிக்கலான ஆவண புரிதல்): 93.28% துல்லியம் – டேபிள்கள், சார்ட்கள், கணித சமன்பாடுகள், பல மொழி ஆவணங்கள் போன்றவற்றில் சிறப்பு.
- Sarvam Indic OCR Bench (புதிதாக உருவாக்கிய இந்திய மொழி பெஞ்ச்மார்க்): 20,267+ மாதிரிகள், 22 இந்திய மொழிகள் (1800களில் இருந்து இன்று வரை). தமிழ், ஹிந்தி போன்ற மொழிகளில் உயர் துல்லியம் (எ.கா. ஹிந்தியில் 95.91%).
இந்திய மொழிகளில் க்ளோபல் மாடல்கள் (Gemini, ChatGPT) பெரும்பாலும் தோல்வியடையும் இடங்களில் – பிராந்திய எழுத்துக்கள், சிக்கலான லேஅவுட், ஸ்கேன்ட் ஆவணங்கள் – சர்வம் மிகச் சிறப்பாக செயல்படுகிறது.
ஏன் இது இந்தியாவுக்கு மிக முக்கியம்?
- பன்மொழி இந்தியா: 22+ மொழிகள், பல எழுத்து முறைகள் – க்ளோபல் AIகள் இதை இரண்டாம் பட்சமாகவே கருதுகின்றன. சர்வம் இந்தியாவுக்காகவே பயிற்றுவிக்கப்பட்டது.
- Sovereign AI: தரவு இந்தியாவுக்குள் இருக்கும், வெளிநாட்டு நிறுவனங்களை சார்ந்திருக்க வேண்டாம். இந்திய அரசின் India AI Mission உடன் இணைந்து செயல்படுகிறது.
- நடைமுறை பயன்பாடு: அரசு ஆவணங்கள் டிஜிட்டல் செய்தல், கல்வி, சுகாதாரம், நீதி, வரலாற்று ஆவணங்கள் பாதுகாப்பு – இவை அனைத்திலும் பெரும் மாற்றம்.
- சமீப செய்திகள்: ஒடிசா & தமிழ்நாடு அரசுகளுடன் MoU, Sovereign AI ஹப் உருவாக்கம் (ஒடிசாவில் 5000 வேலைகள்!), பிப்ரவரி 2026-ல் ஆவண API இலவசம்.
And the world is taking notice.
Founded in 2023, Sarvam AI is an Indian startup focused on what it calls “sovereign AI” — artificial intelligence that is built in India, trained on Indian data, and designed for Indian languages and use cases.
Instead of trying to copy everything ChatGPT or Gemini does, Sarvam took a more focused approach. It asked a simple question: What are global AI models still bad at when it comes to India?
The answer was clear: Indian languages, documents, accents, and messy real-world data.
எதிர்காலம் என்ன?
சர்வம் AI தற்போது பிளேக்ரவுண்ட் (Playground) மூலம் சோதிக்க அனுமதிக்கிறது. பிப்ரவரி 2026-ல் ஆவண உளவியல் API இலவசமாக கிடைக்கும். விரைவில் முழு Large Language Model (LLM) வெளியீடு எதிர்பார்க்கப்படுகிறது (India AI Impact Summit-ஐ சுற்றி).
இது இந்தியாவின் AI சுதந்திரத்தின் மைல்கல்! உலகில் அமெரிக்கா, சீனாவுக்கு அடுத்து இந்தியாவும் தனது சொந்த AI ஸ்டேக் உருவாக்குகிறது என்பதை நிரூபிக்கிறது.
நீங்களும் சோதித்துப் பாருங்கள்: sarvam.ai இல் சென்று Playground-ஐ ட்ரை செய்யுங்கள். தமிழில் ஆவணங்கள் அல்லது படங்களை அப்லோட் செய்து பாருங்கள் – வித்தியாசத்தை உணர்வீர்கள்!
#SarvamAI #IndianAI #SovereignAI #IndicAI #TamilTech
(ஆதாரங்கள்: Times of India, Sarvam AI Official Blog, India Today, Business Standard, Economic Times – பிப்ரவரி 2026 செய்திகள்)

No comments:
Post a Comment