ऑडियो से टेक्स्ट कनवर्टर एपीआई एक शक्तिशाली और सटीक उपकरण है जिसे बोली गई भाषा को संरचित टेक्स्ट में बदलने के लिए डिज़ाइन किया गया है अत्याधुनिक स्पीच पहचान और कृत्रिम बुद्धिमत्ता का उपयोग करते हुए यह विभिन्न उद्योगों और अनुप्रयोगों के लिए उच्च गुणवत्ता वाले प्रतिलेख प्रदान करता है चाहे वह लाइव ऑडियो हो या प्री-रिकॉर्डेड फ़ाइलें यह एपीआई न्यूनतम त्रुटियों के साथ सटीक और विश्वसनीय टेक्स्ट रूपांतरण सुनिश्चित करता है इस एपीआई का एक प्रमुख लाभ इसकी बहुभाषी क्षमता है जो उपयोगकर्ताओं को बहुविविध भाषाओं में ऑडियो को अत्यधिक सटीकता के साथ ट्रांसक्राइब करने की अनुमति देती है यह विभिन्न भाषाओं में ट्रांसक्रिप्शन की आवश्यकता रखने वालों के लिए एक अमूल्य संसाधन बनाता है
परिवर्तन - एंडपॉइंट फीचर्स
| ऑब्जेक्ट | विवरण |
|---|---|
url |
[आवश्यक] Indicates a URL |
{"success":true,"audio_file":"https://s21.aconvert.com/convert/p3r68-cdx67/wma8s-k9scl.mp3","output":{"text":"Oggi che il sole.","result":{"text":"Oggi che il sole.","word_count":4,"vtt":"WEBVTT\n\n00.000 --> 01.120\nOggi che il sole.","words":[{"word":"Oggi","start":0,"end":0.3400000035762787},{"word":"che","start":0.3400000035762787,"end":0.5400000214576721},{"word":"il","start":0.5400000214576721,"end":0.7200000286102295},{"word":"sole.","start":0.7200000286102295,"end":1.1200000047683716}]}}}
curl --location --request POST 'https://zylalabs.com/api/6372/audio+to+text+converter+api/9137/conversion?url=https://s21.aconvert.com/convert/p3r68-cdx67/wma8s-k9scl.mp3' --header 'Authorization: Bearer YOUR_API_KEY'
| हेडर | विवरण |
|---|---|
Authorization
|
[आवश्यक] होना चाहिए Bearer access_key. जब आप सब्सक्राइब हों तो ऊपर "Your API Access Key" देखें। |
कोई लंबी अवधि की प्रतिबद्धता नहीं। कभी भी अपग्रेड, डाउनग्रेड या कैंसल करें। फ्री ट्रायल में 50 रिक्वेस्ट तक शामिल हैं।
संक्रमण अंतिम बिंदु ऑडियो इनपुट से प्राप्त एक संरचित पाठ आउटपुट लौटाता है इसमें ट्रांसक्राइब किया गया पाठ और मैटाडेटा शामिल है जैसे पहचान की गई भाषा आत्मविश्वास स्कोर और यदि लागू हो तो किसी भी टाइमस्टैम्प
प्रतिक्रिया डेटा में मुख्य क्षेत्र आमतौर पर "ट्रांसक्रिप्शन" (परिवर्तित पाठ) "भाषा" (ऑडियो की पहचानी गई भाषा) "कॉन्फिडेंस" (सटीकता स्कोर) और "टाइमस्टैम्प" (यदि सक्षम किया गया हो तो, यह बताता है कि कब शब्द बोला गया) शामिल होते हैं
रूपांतरण एंडपॉइंट मुख्य रूप से "ऑडियो_यूआरएल" पैरामीटर की आवश्यकता होती है जो ट्रांसक्रिप्शन के लिए ऑडियो फ़ाइल का यूआरएल निर्दिष्ट करता है अन्य वैकल्पिक पैरामीटर में "भाषा" शामिल हो सकती है जो ट्रांसक्रिप्शन के लिए वांछित भाषा निर्दिष्ट करता है
प्रतिक्रिया डेटा JSON प्रारूप में संगठित है जिसमें कुंजी-मूल्य जोड़े ट्रांसक्रिप्शन और संबंधित मेटाडेटा का प्रतिनिधित्व करते हैं यह संरचना आसानी से पार्सिंग और अनुप्रयोगों में एकीकरण की अनुमति देती है
विशिष्ट उपयोग के मामलों में बैठकों का लिप्यांतरण करना वीडियो के लिए उपशीर्षक उत्पन्न करना साक्षात्कारों के लिखित रिकॉर्ड बनाना और पॉडकास्ट को पाठ में परिवर्तित करना शामिल है ताकि इसे सुलभता और एसईओ उद्देश्यों के लिए उपयोग किया जा सके
डेटा सटीकता को उन्नत भाषाई मान्यता एल्गोरिदम और विविध ऑडियो डेटा सेट पर निरंतर प्रशिक्षण के माध्यम से बनाए रखा जाता है नियमित अपडेट और गुणवत्ता जांच विभिन्न भाषाओं और उच्चारणों में उच्च रूपांतरण विश्वसनीयता सुनिश्चित करते हैं
उपयोगकर्ता वैकल्पिक पैरामीटर जैसे "भाषा" निर्दिष्ट करके अपनी अनुरोधों को अनुकूलित कर सकते हैं ताकि ट्रांसक्रिप्शन के लिए विशिष्ट भाषाओं को लक्षित किया जा सके जिससे बहुभाषी ऑडियो सामग्री के लिए सटीकता बढ़ सकती है
मानक डेटा पैटर्न में बोले गए सामग्री का स्पष्ट लिप्यांतरण शामिल है जिसकी लंबाई और संरचना ऑडियो गुणवत्ता और जटिलता के आधार पर भिन्न हो सकती है उपयोगकर्ताओं को उम्मीद करनी चाहिए कि पाठ सुसंगत हो जो बोले गए शब्दों से निकटता से मेल खाता हो
सर्विस लेवल:
100%
रिस्पॉन्स टाइम:
8,434ms
सर्विस लेवल:
100%
रिस्पॉन्स टाइम:
16ms
सर्विस लेवल:
100%
रिस्पॉन्स टाइम:
365ms
सर्विस लेवल:
100%
रिस्पॉन्स टाइम:
1,664ms
सर्विस लेवल:
100%
रिस्पॉन्स टाइम:
9,827ms
सर्विस लेवल:
100%
रिस्पॉन्स टाइम:
2,807ms
सर्विस लेवल:
99%
रिस्पॉन्स टाइम:
461ms
सर्विस लेवल:
100%
रिस्पॉन्स टाइम:
13ms
सर्विस लेवल:
100%
रिस्पॉन्स टाइम:
835ms
सर्विस लेवल:
100%
रिस्पॉन्स टाइम:
1,281ms
सर्विस लेवल:
50%
रिस्पॉन्स टाइम:
10,867ms
सर्विस लेवल:
100%
रिस्पॉन्स टाइम:
1,075ms
सर्विस लेवल:
100%
रिस्पॉन्स टाइम:
360ms
सर्विस लेवल:
100%
रिस्पॉन्स टाइम:
3,641ms
सर्विस लेवल:
100%
रिस्पॉन्स टाइम:
137ms
सर्विस लेवल:
100%
रिस्पॉन्स टाइम:
2,378ms
सर्विस लेवल:
100%
रिस्पॉन्स टाइम:
20ms
सर्विस लेवल:
100%
रिस्पॉन्स टाइम:
2,199ms
सर्विस लेवल:
100%
रिस्पॉन्स टाइम:
1,269ms
सर्विस लेवल:
100%
रिस्पॉन्स टाइम:
394ms