কৃত্রিম বুদ্ধিমত্তা (এআই) প্রযুক্তিনির্ভর ভয়েস এজেন্টের কার্যকারিতা উন্নত করতে নতুন অডিও মডেল তৈরি করেছে চ্যাটজিপিটির নির্মাতা প্রতিষ্ঠান ওপেনএআই। প্রাথমিকভাবে ডেভেলপারদের জন্য উন্মুক্ত করা মডেলটি কাজে লাগিয়ে এআই ভয়েস এজেন্টগুলোয় বাস্তবসম্মত ও স্বতঃস্ফূর্ত কথোপকথনের সুযোগ পাওয়া যাবে।

প্রযুক্তি–বিশ্লেষকদের মতে, মুখের কথা যোগাযোগের সবচেয়ে স্বাভাবিক মাধ্যম হলেও কৃত্রিম বুদ্ধিমত্তা প্রযুক্তিতে এটি এখনো যথাযথভাবে ব্যবহার করা হচ্ছে না। তবে ওপেনএআইয়ের নতুন উদ্ভাবন এই চিত্র বদলে দিতে পারে। মডেলটিতে থাকা উন্নত স্পিচ-টু-টেক্সট ও টেক্সট-টু-স্পিচ প্রযুক্তির মাধ্যমে কৃত্রিম বুদ্ধিমত্তাভিত্তিক ভয়েস অ্যাসিস্ট্যান্ট আরও স্বতঃস্ফূর্ত ও কার্যকর হবে। গ্রাহকসেবা, ভাষাশিক্ষা এবং বিশেষ চাহিদাসম্পন্ন ব্যক্তিদের সহায়ক প্রযুক্তি হিসেবে মডেলটি নতুন সম্ভাবনার দ্বার উন্মোচন করবে।

আরও পড়ুনলেখা থেকে ভিডিও তৈরির এআই টুল নিয়ে বিপাকে ওপেনএআই, কারণ কী২৯ নভেম্বর ২০২৪

ওপেনএআইয়ের নতুন অডিও মডেলটিতে বেশ কয়েকটি গুরুত্বপূর্ণ সুবিধা যুক্ত করা হয়েছে, যার মধ্যে উন্নত স্পিচ-টু-টেক্সট, টেক্সট-টু-স্পিচ মডেলসহ হালানাগাদ এজেন্টস এসডিকে অন্যতম। নতুন স্পিচ-টু-টেক্সট সুবিধা আগের হুইস্পার সংস্করণের তুলনায় আরও নির্ভুল ও দ্রুত কাজ করতে পারে। ফলে বর্তমানের তুলনায় নির্ভুলভাবে মুখের কথাকে লেখায় রূপান্তর করা যাবে। এ ছাড়া এজেন্টস এসডিকের নতুন হালনাগাদের মাধ্যমে ডেভেলপাররা সহজেই লেখাভিত্তিক কৃত্রিম বুদ্ধিমত্তা সহকারীকে কণ্ঠস্বরভিত্তিক ইন্টারঅ্যাকশন সিস্টেমে রূপান্তর করতে পারবেন।

ওপেনএআই দাবি করেছে, নতুন মডেলটি আগের হুইস্পার সংস্করণের তুলনায় আরও নির্ভুল এবং সবচেয়ে কম বিভ্রান্তিকর তথ্য প্রদান করে। এর ফলে গ্রাহকসেবা, ভাষাশিক্ষা এবং বিশেষ চাহিদাসম্পন্ন ব্যবহারকারীদের জন্য সহায়ক প্রযুক্তি হিসেবে মডেলটি নতুন সম্ভাবনার দ্বার উন্মোচন করবে।

সূত্র: ইন্ডিয়ান এক্সপ্রেস

.

উৎস: Prothomalo

কীওয়ার্ড: ক ত র ম ব দ ধ মত ত

এছাড়াও পড়ুন:

নতুন এআই অডিও মডেল তৈরি করেছে ওপেনএআই, যে সুবিধা পাওয়া যাবে

কৃত্রিম বুদ্ধিমত্তা (এআই) প্রযুক্তিনির্ভর ভয়েস এজেন্টের কার্যকারিতা উন্নত করতে নতুন অডিও মডেল তৈরি করেছে চ্যাটজিপিটির নির্মাতা প্রতিষ্ঠান ওপেনএআই। প্রাথমিকভাবে ডেভেলপারদের জন্য উন্মুক্ত করা মডেলটি কাজে লাগিয়ে এআই ভয়েস এজেন্টগুলোয় বাস্তবসম্মত ও স্বতঃস্ফূর্ত কথোপকথনের সুযোগ পাওয়া যাবে।

প্রযুক্তি–বিশ্লেষকদের মতে, মুখের কথা যোগাযোগের সবচেয়ে স্বাভাবিক মাধ্যম হলেও কৃত্রিম বুদ্ধিমত্তা প্রযুক্তিতে এটি এখনো যথাযথভাবে ব্যবহার করা হচ্ছে না। তবে ওপেনএআইয়ের নতুন উদ্ভাবন এই চিত্র বদলে দিতে পারে। মডেলটিতে থাকা উন্নত স্পিচ-টু-টেক্সট ও টেক্সট-টু-স্পিচ প্রযুক্তির মাধ্যমে কৃত্রিম বুদ্ধিমত্তাভিত্তিক ভয়েস অ্যাসিস্ট্যান্ট আরও স্বতঃস্ফূর্ত ও কার্যকর হবে। গ্রাহকসেবা, ভাষাশিক্ষা এবং বিশেষ চাহিদাসম্পন্ন ব্যক্তিদের সহায়ক প্রযুক্তি হিসেবে মডেলটি নতুন সম্ভাবনার দ্বার উন্মোচন করবে।

আরও পড়ুনলেখা থেকে ভিডিও তৈরির এআই টুল নিয়ে বিপাকে ওপেনএআই, কারণ কী২৯ নভেম্বর ২০২৪

ওপেনএআইয়ের নতুন অডিও মডেলটিতে বেশ কয়েকটি গুরুত্বপূর্ণ সুবিধা যুক্ত করা হয়েছে, যার মধ্যে উন্নত স্পিচ-টু-টেক্সট, টেক্সট-টু-স্পিচ মডেলসহ হালানাগাদ এজেন্টস এসডিকে অন্যতম। নতুন স্পিচ-টু-টেক্সট সুবিধা আগের হুইস্পার সংস্করণের তুলনায় আরও নির্ভুল ও দ্রুত কাজ করতে পারে। ফলে বর্তমানের তুলনায় নির্ভুলভাবে মুখের কথাকে লেখায় রূপান্তর করা যাবে। এ ছাড়া এজেন্টস এসডিকের নতুন হালনাগাদের মাধ্যমে ডেভেলপাররা সহজেই লেখাভিত্তিক কৃত্রিম বুদ্ধিমত্তা সহকারীকে কণ্ঠস্বরভিত্তিক ইন্টারঅ্যাকশন সিস্টেমে রূপান্তর করতে পারবেন।

ওপেনএআই দাবি করেছে, নতুন মডেলটি আগের হুইস্পার সংস্করণের তুলনায় আরও নির্ভুল এবং সবচেয়ে কম বিভ্রান্তিকর তথ্য প্রদান করে। এর ফলে গ্রাহকসেবা, ভাষাশিক্ষা এবং বিশেষ চাহিদাসম্পন্ন ব্যবহারকারীদের জন্য সহায়ক প্রযুক্তি হিসেবে মডেলটি নতুন সম্ভাবনার দ্বার উন্মোচন করবে।

সূত্র: ইন্ডিয়ান এক্সপ্রেস

সম্পর্কিত নিবন্ধ