वॉइस ट्रांसक्रिप्शन एपीआई बोले गए शब्दों को संरचित पाठ में परिवर्तित करने के लिए एक उन्नत और विश्वसनीय समाधान है। अत्याधुनिक स्पीच रिकॉग्निशन और आर्टिफिशियल इंटेलिजेंस का लाभ उठाते हुए यह विभिन्न उद्योगों और अनुप्रयोगों के लिए अनुकूलित सटीक ट्रांसक्रिप्शन प्रदान करता है। चाहे यह वास्तविक समय की बोली का प्रोसेसिंग हो या रिकॉर्डेड ऑडियो, यह एपीआई न्यूनतम गलतियों के साथ सटीक और कुशल टेक्स्ट रूपांतरण की गारंटी देता है
इसके प्रमुख फीचर्स में से एक बहुभाषी समर्थन है जो उपयोगकर्ताओं को विभिन्न भाषाओं में ऑडियो कोRemarkable precision के साथ ट्रांसक्रिप्ट करने की अनुमति देता है। यह उन लोगों के लिए एक आवश्यक उपकरण बनाता है जिन्हें विभिन्न भाषाई परिप्रेक्ष्य में उच्च गुणवत्ता वाले ट्रांसक्रिप्शन की आवश्यकता है
प्रतिलेखन - एंडपॉइंट फीचर्स
| ऑब्जेक्ट | विवरण |
|---|---|
url |
[आवश्यक] Indicates a URL |
{"success":true,"audio_file":"https://s31.aconvert.com/convert/p3r68-cdx67/s49sb-3bftf.mp3","output":{"text":"Ciao a tutti, come state?","result":{"text":"Ciao a tutti, come state?","word_count":5,"vtt":"WEBVTT\n\n00.000 --> 01.860\nCiao a tutti, come state?","words":[{"word":"Ciao","start":0,"end":0.23999999463558197},{"word":"a","start":0.23999999463558197,"end":0.4000000059604645},{"word":"tutti,","start":0.4000000059604645,"end":1.0800000429153442},{"word":"come","start":1.0800000429153442,"end":1.2799999713897705},{"word":"state?","start":1.2799999713897705,"end":1.8600000143051147}]}}}
curl --location --request GET 'https://zylalabs.com/api/6376/voice+transcription+api/9143/transcription?url=https://imgv3.fotor.com/images/blog-richtext-image/make-a-watermark-for-a-landscape-image.jpg' --header 'Authorization: Bearer YOUR_API_KEY'
| हेडर | विवरण |
|---|---|
Authorization
|
[आवश्यक] होना चाहिए Bearer access_key. जब आप सब्सक्राइब हों तो ऊपर "Your API Access Key" देखें। |
कोई लंबी अवधि की प्रतिबद्धता नहीं। कभी भी अपग्रेड, डाउनग्रेड या कैंसल करें। फ्री ट्रायल में 50 रिक्वेस्ट तक शामिल हैं।
स्पीच एनालिसिस एपीआई ऑडियो इनपुट से ट्रांसक्राइब किए गए टेक्स्ट को वापस करता है आउटपुट में टेक्स्ट प्रारूप में पहचानी गई स्पीच शामिल होती है जिसे उपशीर्षक दस्तावेज़ीकरण या विश्लेषण जैसे विभिन्न अनुप्रयोगों के लिए उपयोग किया जा सकता है
प्रतिक्रिया डेटा में मुख्य क्षेत्र आमतौर पर "ट्रांसक्रिप्शन" के लिए रूपांतरित पाठ "भाषा" के लिए जो पहचानी गई भाषा को इंगित करता है और "विश्वास" जो ट्रांसक्रिप्शन की सटीकता को दर्शाता है
पीओएसटी ऑब्टेन टेक्स्ट एंडपॉइंट के लिए प्राथमिक पैरामीटर "ऑडियो_यूआरएल" है जो ट्रांस्क्राइब किए जाने वाले ऑडियो फ़ाइल के यूआरएल को निर्दिष्ट करता है अतिरिक्त पैरामीटर में "भाषा" शामिल हो सकती है जो ट्रांस्क्रिप्शन के लिए इच्छित भाषा को निर्दिष्ट करती है
प्रतिक्रिया डेटा एक JSON प्रारूप में व्यवस्थित है जिसमें कुंजी-मूल्य युग्म होते हैं मुख्य संरचना में ट्रांस्क्रिप्शन भाषा और आत्मविश्वास स्कोर के लिए क्षेत्र शामिल हैं जिससे एप्लिकेशन में आसान पार्सिंग और एकीकरण संभव है
प्रमुख उपयोग मामलों में वीडियो के लिए सबटाइटल बनाना मीटिंग या इंटरव्यू के लिए ट्रांसक्रिप्ट तैयार करना सुनने में असमर्थ उपयोगकर्ताओं के लिए पहुंच को बेहतर बनाना और विभिन्न उद्योगों में अंतर्दृष्टि के लिए बोले गए सामग्री का विश्लेषण करना शामिल है
डेटा सटीकता को उन्नत भाषण पहचान एल्गोरिदम और विविध डेटा सेट पर निरंतर प्रशिक्षण के माध्यम से बनाए रखा जाता है एपीआई गुणवत्ता जांच का भी उपयोग करता है ताकि त्रुटियों को कम किया जा सके और ट्रांसक्रिप्शन की विश्वसनीयता में सुधार हो सके
उपयोगकर्ता अपनी अनुरोधों को अनुकूलित कर सकते हैं "भाषा" पैरामीटर को निर्दिष्ट करके विशिष्ट भाषाओं के लिए ट्रांसक्रिप्शन को लक्षित करने के लिए यह ऑडियो सामग्री की भाषाई संदर्भ के आधार पर अनुकूलित आउटपुट की अनुमति देता है
मानक डेटा पैटर्न में उचित विराम चिह्न और पूंजीकरण के साथ स्पष्ट वाक्य शामिल होते हैं उपयोगकर्ता ऑडियो गुणवत्ता वक्ता के उच्चारण और बैकग्राउंड शोर स्तरों के आधार पर सटीकता में भिन्नताएँ उम्मीद कर सकते हैं
सर्विस लेवल:
100%
रिस्पॉन्स टाइम:
11,869ms
सर्विस लेवल:
100%
रिस्पॉन्स टाइम:
2,452ms
सर्विस लेवल:
100%
रिस्पॉन्स टाइम:
2,228ms
सर्विस लेवल:
100%
रिस्पॉन्स टाइम:
320ms
सर्विस लेवल:
100%
रिस्पॉन्स टाइम:
3,761ms
सर्विस लेवल:
100%
रिस्पॉन्स टाइम:
10,033ms
सर्विस लेवल:
100%
रिस्पॉन्स टाइम:
3,497ms
सर्विस लेवल:
100%
रिस्पॉन्स टाइम:
286ms
सर्विस लेवल:
100%
रिस्पॉन्स टाइम:
919ms
सर्विस लेवल:
100%
रिस्पॉन्स टाइम:
2,845ms
सर्विस लेवल:
100%
रिस्पॉन्स टाइम:
343ms
सर्विस लेवल:
100%
रिस्पॉन्स टाइम:
315ms
सर्विस लेवल:
100%
रिस्पॉन्स टाइम:
87ms
सर्विस लेवल:
100%
रिस्पॉन्स टाइम:
4,288ms
सर्विस लेवल:
100%
रिस्पॉन्स टाइम:
601ms
सर्विस लेवल:
100%
रिस्पॉन्स टाइम:
3,471ms
सर्विस लेवल:
100%
रिस्पॉन्स टाइम:
2,347ms
सर्विस लेवल:
100%
रिस्पॉन्स टाइम:
1,930ms
सर्विस लेवल:
100%
रिस्पॉन्स टाइम:
309ms
सर्विस लेवल:
100%
रिस्पॉन्स टाइम:
2,756ms