گروه پردازش صوت شرکت ویراصنعت شریف از کارشناسان متخصص در حوزه پردازش صوت و گفتار با استفاده از الگوریتم های هوش مصنوعی و کلاسیک دعوت به همکاری می نماید. اگر در زمینه تبدیل گفتار به متن متن به گفتار تفکیک گویندگان و ... با استفاده از مدل های یادگیری عمیق تجربه کاری دارید این موقعیت مناسب شماست.
مهارتهای موردنیاز:
1) تسلط کامل بر زبان برنامهنویسی Python
2) تسلط بر مفاهیم پردازش سیگنال گفتار (Speech Processing) و پردازش متن (NLP)
3) تجربه عملی کار با کتابخانهها و فریمورکهای مرتبط با پردازش گفتار و متن
4) آشنایی با مدلهای یادگیری عمیق در حوزه گفتار، شامل:
- تبدیل گفتار به متن (ASR)
- تفکیک و شناسایی گویندگان (Speaker Diarization)
5) تسلط بر پیشپردازش سیگنال گفتار، از جمله:
- حذف نویز (Noise Reduction)
- نرمالسازی، قطعهبندی و پاکسازی دادههای صوتی
6) توانایی مدیریت چرخه داده در پروژههای گفتار، شامل:
- جمعآوری و سازماندهی دیتاست
- پالایش، پاکسازی و اعتبارسنجی دادهها
- برچسبگذاری و آمادهسازی داده برای آموزش مدل
7) تجربه در Fine-Tuning و بهینهسازی مدلهای گفتار به متن و تفکیک گوینده
8) آشنایی با معیارهای ارزیابی مدلهای گفتار (مانند WER و DER)