บทนำ Audio to text (recognition)
แอปพลิเคชัน ไฟล์เสียงเป็นข้อความ ได้รับการออกแบบมาเพื่อจดจำไฟล์เสียงที่มีคำพูดของมนุษย์เป็นข้อความ (เสียงพูดเป็นข้อความ) แอปพลิเคชันนี้ยังไม่ได้มีไว้สำหรับบันทึกเสียงพูด (ใช้แอปพลิเคชันอื่นสำหรับสิ่งนี้เช่นเครื่องบันทึกเสียงมาตรฐาน)
เราไม่แนะนำ ให้ใช้สำหรับการจดจำคำจากเพลงวิดีโอและการบันทึกอื่น ๆ ที่มีเสียงรบกวนภายนอก (ยกเว้นเสียงของผู้พูด) ในกรณีนี้การรับรู้มักจะไม่เป็นที่น่าพอใจ
เราขอแนะนำ ให้ใช้เพื่อจดจำการบันทึกเสียงที่มีคุณภาพเสียงสูงเมื่อลำโพงอยู่ใกล้กับอุปกรณ์บันทึกเสียงมากที่สุดและไม่มีเสียงรบกวนจากภายนอก
คุณสมบัติการใช้งาน:
- จดจำการบันทึกเสียงสั้น ๆ (ความยาวสูงสุด 1 นาที)
- การจดจำการบันทึกเสียงแบบยาว (ยาวกว่า 1 นาที)
- รองรับการจดจำรูปแบบเสียงส่วนใหญ่ - MP3, OGG (opus Codec), AAC, MPEG, AMR, WAV, M4A, FLAC และอื่น ๆ แต่เราขอแนะนำให้ใช้. FLAC
- รองรับการจดจำจาก 120 ภาษา
-“ เครื่องหมายวรรคตอนอัตโนมัติ” มีให้บริการในบางภาษา
- ข้อความที่จดจำจะถูกบันทึกไว้ในแอปพลิเคชัน
- ความสามารถในการ "แบ่งปัน" ข้อความด้วยวิธีการทางโทรศัพท์ที่มีอยู่
- ความสามารถในการแก้ไขข้อความด้วยตนเอง
- ความสามารถในการส่งออกเป็นรูปแบบข้อความ (สำหรับ Android <10 เวอร์ชัน)
- การรับรู้ไฟล์เสียงหลังจาก "แชร์" จากแอปพลิเคชันอื่น ๆ (ตัวอย่างเช่น Whats App - ข้อความเสียงและแอปพลิเคชันสำหรับดูไฟล์)
วิธีการทำงาน:
1) คุณเลือกไฟล์เสียงของบุคคล
2) เลือกภาษาสำหรับการจดจำและการตั้งค่าเพิ่มเติม (ถ้ามีสำหรับภาษาที่เลือก)
3) กดปุ่ม“ เริ่ม”
4) ไฟล์เสียงถูกดาวน์โหลดไปยังเซิร์ฟเวอร์และรูปแบบจะถูกแปลงเป็น FLAC
5) หลังจากการแปลงจะมีการร้องขอเป็น Speech-To-Text และเซิร์ฟเวอร์จะส่งคืนผลลัพธ์การจดจำ
การรู้จำเสียงใช้โซลูชันระบบคลาวด์ของ Google - Speech to text ซึ่งต้องชำระเงินสำหรับการจดจำหน่วยเวลาดังนั้นแอปพลิเคชันจึงไม่ฟรีและสำหรับการจดจำแต่ละครั้งเราถูกบังคับให้เรียกเก็บเงินจากผู้ใช้ โปรดปฏิบัติต่อสิ่งนี้ด้วยความเข้าใจ
เราไม่แนะนำ ให้ใช้สำหรับการจดจำคำจากเพลงวิดีโอและการบันทึกอื่น ๆ ที่มีเสียงรบกวนภายนอก (ยกเว้นเสียงของผู้พูด) ในกรณีนี้การรับรู้มักจะไม่เป็นที่น่าพอใจ
เราขอแนะนำ ให้ใช้เพื่อจดจำการบันทึกเสียงที่มีคุณภาพเสียงสูงเมื่อลำโพงอยู่ใกล้กับอุปกรณ์บันทึกเสียงมากที่สุดและไม่มีเสียงรบกวนจากภายนอก
คุณสมบัติการใช้งาน:
- จดจำการบันทึกเสียงสั้น ๆ (ความยาวสูงสุด 1 นาที)
- การจดจำการบันทึกเสียงแบบยาว (ยาวกว่า 1 นาที)
- รองรับการจดจำรูปแบบเสียงส่วนใหญ่ - MP3, OGG (opus Codec), AAC, MPEG, AMR, WAV, M4A, FLAC และอื่น ๆ แต่เราขอแนะนำให้ใช้. FLAC
- รองรับการจดจำจาก 120 ภาษา
-“ เครื่องหมายวรรคตอนอัตโนมัติ” มีให้บริการในบางภาษา
- ข้อความที่จดจำจะถูกบันทึกไว้ในแอปพลิเคชัน
- ความสามารถในการ "แบ่งปัน" ข้อความด้วยวิธีการทางโทรศัพท์ที่มีอยู่
- ความสามารถในการแก้ไขข้อความด้วยตนเอง
- ความสามารถในการส่งออกเป็นรูปแบบข้อความ (สำหรับ Android <10 เวอร์ชัน)
- การรับรู้ไฟล์เสียงหลังจาก "แชร์" จากแอปพลิเคชันอื่น ๆ (ตัวอย่างเช่น Whats App - ข้อความเสียงและแอปพลิเคชันสำหรับดูไฟล์)
วิธีการทำงาน:
1) คุณเลือกไฟล์เสียงของบุคคล
2) เลือกภาษาสำหรับการจดจำและการตั้งค่าเพิ่มเติม (ถ้ามีสำหรับภาษาที่เลือก)
3) กดปุ่ม“ เริ่ม”
4) ไฟล์เสียงถูกดาวน์โหลดไปยังเซิร์ฟเวอร์และรูปแบบจะถูกแปลงเป็น FLAC
5) หลังจากการแปลงจะมีการร้องขอเป็น Speech-To-Text และเซิร์ฟเวอร์จะส่งคืนผลลัพธ์การจดจำ
การรู้จำเสียงใช้โซลูชันระบบคลาวด์ของ Google - Speech to text ซึ่งต้องชำระเงินสำหรับการจดจำหน่วยเวลาดังนั้นแอปพลิเคชันจึงไม่ฟรีและสำหรับการจดจำแต่ละครั้งเราถูกบังคับให้เรียกเก็บเงินจากผู้ใช้ โปรดปฏิบัติต่อสิ่งนี้ด้วยความเข้าใจ
เพิ่มเติม