কথোপকথন, অনুবাদ ও ট্রান্সক্রিপশনে নতুন মডেল এনেছে ওপেনএআই

Tech World Desk

টেক ওয়ার্ল্ড ডেস্ক

রবিবার, ১০ মে ২০২৬, ১৭:৫৬

কথোপকথন, অনুবাদ ও ট্রান্সক্রিপশনে নতুন মডেল এনেছে ওপেনএআই
ছবি : টেকক্রাঞ্চ

কৃত্রিম বুদ্ধিমত্তা প্রতিষ্ঠান ওপেনএআই তাদের অ্যাপ্লিকেশন প্রোগ্রামিং ইন্টারফেস (এপিআই)তে নতুন কয়েকটি ভয়েস ইন্টেলিজেন্স ফিচার যুক্ত করেছে। এসব ফিচারের মাধ্যমে ডেভেলপাররা এমন অ্যাপ তৈরি করতে পারবেন, যা ব্যবহারকারীর সঙ্গে কথা বলতে পারবে, কথোপকথন লিখে রাখতে পারবে এবং তা অনুবাদও করতে পারবে।

নতুন ঘোষিত জিপিটি-রিয়েলটাইম-২ একটি উন্নত ভয়েস মডেল, যা স্বাভাবিক কণ্ঠে ব্যবহারকারীর সঙ্গে কথোপকথন করতে সক্ষম। আগের সংস্করণ জিপিটি-রিয়েলটাইম-১.৫ এর তুলনায় এটি আরও উন্নত যুক্তিবোধসম্পন্ন। ওপেনএআই জানিয়েছে, এই মডেল জটিল অনুরোধও ভালোভাবে বুঝে উত্তর দিতে পারে।

এছাড়া চালু করা হয়েছে জিপিটি-রিয়েলটাইম-ট্রান্সলেট, যা রিয়েলটাইমে ভাষা অনুবাদ করতে পারে। এটি ৭০টির বেশি ইনপুট ভাষা বুঝতে পারে এবং ১৩টি ভাষায় আউটপুট দিতে পারে। কথোপকথনের গতির সঙ্গে মিল রেখে অনুবাদ করার সক্ষমতাও এতে রয়েছে।

তৃতীয় ফিচার হলো জিপিটি-রিয়েলটাইম-হুইস্পার, যা সরাসরি কথাকে লেখায় রূপান্তর করে। ব্যবহারকারীর কথা বলার সময়ই তা টেক্সটে পরিণত হয়, ফলে লাইভ ট্রান্সক্রিপশন সম্ভব হয়।

ওপেনএআই জানিয়েছে, এই তিনটি মডেল একসঙ্গে রিয়েলটাইম অডিও প্রযুক্তিকে আরও কার্যকর পর্যায়ে নিয়ে যাবে। এখন শুধু কথার জবাব নয়, বরং শোনা, বোঝা, অনুবাদ করা, লিখে রাখা এবং প্রয়োজনে কাজ সম্পন্ন করাও সম্ভব হবে।

এই প্রযুক্তি সবচেয়ে বেশি কাজে লাগতে পারে গ্রাহকসেবা, শিক্ষা, মিডিয়া, ইভেন্ট ব্যবস্থাপনা এবং কনটেন্ট প্ল্যাটফর্মে।

তবে প্রযুক্তিটির অপব্যবহারের ঝুঁকিও রয়েছে বলে সতর্ক করেছে প্রতিষ্ঠানটি। ওপেনএআই জানিয়েছে, স্প্যাম, প্রতারণা বা ক্ষতিকর ব্যবহার রোধে নিরাপত্তা ব্যবস্থা যুক্ত করা হয়েছে। কোনো ক্ষতিকর আচরণ শনাক্ত হলে কথোপকথন স্বয়ংক্রিয়ভাবে বন্ধও করা হতে পারে।

নতুন সব ভয়েস মডেল ওপেনএআইয়ের রিয়েলটাইম এপিআইতে যুক্ত করা হয়েছে। এর মধ্যে অনুবাদ ও হুইস্পার মিনিটভিত্তিক চার্জে ব্যবহৃত হবে, আর জিপিটি-রিয়েলটাইম-২ টোকেন ব্যবহারের ভিত্তিতে বিল করা হবে।

টেকওয়ার্ল্ডের আপডেটেড খবর পেতে WhatsApp চ্যানেল ফলো করুন