बहुभाषी EPUB पहुंच के लिए सर्वोत्तम प्रथाएं

बहुभाषी EPUBs बनाना जो सुलभ हों, यह सुनिश्चित करता है कि हर कोई, भाषा या विकलांगता की परवाह किए बिना, डिजिटल पुस्तकों का आनंद ले सकता है। यहाँ इसे कैसे काम करना है:

भाषा मेटाडेटा: अपने EPUB में प्राथमिक और माध्यमिक भाषाओं को घोषित करने के लिए <dc:language> का उपयोग करें। यह स्क्रीन रीडर और ब्रेल डिस्प्ले को सही सेटिंग्स लोड करने में मदद करता है।
भाषा मार्कअप: सटीक उच्चारण और टेक्स्ट-टू-स्पीच प्रदर्शन के लिए भाषा परिवर्तन को संकेत देने के लिए अपनी सामग्री में xml:lang टैग जोड़ें।
गैर-लैटिन लिपियां: उपयुक्त फॉन्ट एम्बेड करें और यूनिकोड अनुपालन सुनिश्चित करें ताकि लापता वर्णों जैसी प्रदर्शन समस्याओं से बचा जा सके।
पहुंच मानक: पहुंच दिशानिर्देशों को पूरा करने के लिए WCAG 2.x (स्तर AA), EPUB 3.3, और BCP 47 मानकों का पालन करें।
परीक्षण उपकरण: EPUBCheck, Ace by DAISY, और Thorium Reader जैसे उपकरणों के साथ अपने EPUB को मान्य करें ताकि पहुंच सुविधाएं इच्छानुसार काम करें।

सुलभ बहुभाषी EPUBs बनाने के लिए 5-चरण प्रक्रिया

EPUB पहुंच 101

मेटाडेटा और भाषा घोषणा

सटीक मेटाडेटा सेट करना बहुभाषी EPUBs को सुलभ बनाने की नींव है। आपकी EPUB पैकेज दस्तावेज़ (OPF फ़ाइल) में <metadata> अनुभाग सहायक प्रौद्योगिकियों को बताता है कि आपकी पुस्तक में कौन सी भाषाएं शामिल हैं। यह स्क्रीन रीडर और ब्रेल डिस्प्ले जैसी उपकरणों को सही सेटिंग्स - जैसे भाषण संश्लेषक या ब्रेल टेबल - तुरंत लोड करने में सुनिश्चित करता है। इस जानकारी के बिना, सहायक प्रौद्योगिकियां गलत भाषा पर डिफ़ॉल्ट हो सकती हैं, जो उन उपयोगकर्ताओं के लिए अनावश्यक चुनौतियां पैदा करता है जो उन पर निर्भर हैं। आपके EPUB में प्राथमिक और माध्यमिक भाषाओं को घोषित करना इस मेटाडेटा सेटअप से शुरू होता है।

प्राथमिक और माध्यमिक भाषाओं को कैसे घोषित करें

डबलिन कोर <dc:language> तत्व आपके EPUB में भाषाओं की पहचान करने की जाने-माने विधि है। बहुभाषी पुस्तकों के लिए, आपको कई <dc:language> टैग जोड़ने की आवश्यकता होगी - आपकी सामग्री में प्रत्येक भाषा के लिए एक। हमेशा प्राथमिक भाषा को पहले सूचीबद्ध करें, क्योंकि Google Play Books जैसे प्लेटफॉर्म इसे अपनी पुस्तक को सही तरीके से वर्गीकृत करने के लिए उपयोग करते हैं। पोलिश फाउंडेशन फॉर द ब्लाइंड एंड विजुअली इम्पेयर्ड "Trakt" की मोनिका ज़ार्ज़ुक-एंजेल्समा इस बात को उजागर करती हैं:

EPUB मेटाडेटा में सभी पुस्तक भाषाओं को शामिल करें।

ऐसा करने से यह सुनिश्चित होता है कि रीफ्रेशेबल ब्रेल डिस्प्ले स्वचालित रूप से सही ब्रेल टेबल पर समायोजित हों, जो अंधे पाठकों के लिए विभिन्न भाषाओं में वर्तनी और विराम चिह्न को सही तरीके से व्याख्या करने के लिए आवश्यक है। बहुभाषी सामग्री के लिए, EPUB 3 EPUB 2 पर अत्यधिक अनुशंसित है, क्योंकि पुरानी संस्करण में refines विशेषता की कमी है, जो सहायक प्रौद्योगिकियों द्वारा मेटाडेटा को संसाधित करने के तरीके में भ्रम का कारण बन सकती है।

सही भाषा कोड का उपयोग करना

पढ़ने की प्रणालियों और सहायक उपकरणों के साथ अनुकूलता सुनिश्चित करने के लिए, ISO 639-1 दो-अक्षर कोड का उपयोग करें (उदाहरण के लिए, अंग्रेजी के लिए 'en', स्पेनिश के लिए 'es')। यहाँ सामान्य भाषाओं और उनके सही मेटाडेटा प्रारूप के लिए एक त्वरित संदर्भ है:

भाषा	ISO 639-1 कोड	मेटाडेटा उदाहरण
अंग्रेजी	en	`<dc:language>en</dc:language>`
स्पेनिश	es	`<dc:language>es</dc:language>`
फ्रेंच	fr	`<dc:language>fr</dc:language>`
जापानी	ja	`<dc:language>ja</dc:language>`
पोलिश	pl	`<dc:language>pl</dc:language>`
जर्मन	de	`<dc:language>de</dc:language>`

संगति महत्वपूर्ण है। आपके मेटाडेटा में भाषा कोड आपकी HTML सामग्री में भाषा टैग से मेल खाना चाहिए, जो xml:lang विशेषता का उपयोग करके परिभाषित किए जाते हैं। यह संरेखण स्क्रीन रीडर को आपकी पुस्तक के माध्यम से नेविगेट करते समय भाषाओं को निरंतर स्विच करने की अनुमति देता है, गलत उच्चारण जैसी समस्याओं से बचता है।

सामग्री दस्तावेज़ों में भाषा मार्कअप

एक बार जब आप किसी पुस्तक के लिए सटीक भाषा मेटाडेटा सेट कर लेते हैं, तो अगला कदम पाठ में सटीक भाषा मार्कअप सुनिश्चित करना है। इसमें xml:lang विशेषता का उपयोग करके सामग्री के भीतर भाषा परिवर्तन को चिह्नित करना शामिल है। यह महत्वपूर्ण क्यों है? यह स्क्रीन रीडर और टेक्स्ट-टू-स्पीच उपकरणों को यह जानने में मदद करता है कि कब भाषाओं को स्विच करना है। यह सही उच्चारण और उचित ध्वन्यात्मक नियमों को लागू करने में सुनिश्चित करता है। इसके बिना, एक स्क्रीन रीडर गलत भाषा के नियमों को लागू करके शब्दों का गलत उच्चारण कर सकता है, जिससे भ्रम पैदा होता है।

भाषा स्विचिंग के लिए `xml:lang` का उपयोग करना

xml:lang विशेषता EPUB 3 सामग्री में भाषा परिवर्तन को चिह्नित करने के लिए आवश्यक है। आप इसे छोटे वाक्यांशों के लिए  जैसे इनलाइन तत्वों पर, या लंबे अनुभागों के लिए  या <div> जैसे ब्लॉक-स्तरीय तत्वों पर उपयोग कर सकते हैं। उदाहरण के लिए, यदि आपकी अंग्रेजी पुस्तक में एक फ्रेंच उद्धरण शामिल है, तो आप इसे इस तरह चिह्नित करेंगे:
Bonjour
यह स्क्रीन रीडर को फ्रेंच भाषण संश्लेषक पर स्विच करने का संकेत देता है और रीफ्रेशेबल ब्रेल डिस्प्ले को सही ब्रेल टेबल का उपयोग करने में सुनिश्चित करता है।

पोलिश फाउंडेशन फॉर द ब्लाइंड एंड विजुअली इम्पेयर्ड "Trakt" की मोनिका ज़ार्ज़ुक-एंजेल्समा इसके महत्व को उजागर करती हैं:

xml:lang विशेषता का उपयोग किसी पाठ में दूसरी भाषा में लिखे गए भागों को चिह्नित करने के लिए किया जा सकता है... इस तरह, स्क्रीन रीडर किसी दी गई भाषा के अनुरूप भाषण संश्लेषक पर स्विच कर सकते हैं।

अरबी या हिब्रू जैसी दाएं-से-बाएं भाषाओं के लिए, संबंधित तत्व पर xml:lang के साथ dir="rtl" शामिल करें। यह उचित रेंडरिंग और पढ़ने के क्रम को बनाए रखता है। विभिन्न स्क्रीन रीडर में अनुकूलता सुनिश्चित करने के लिए हमेशा दो-वर्ण ISO कोड का उपयोग करें (उदाहरण के लिए, en, es, fr)।

आगे, यह तय करना महत्वपूर्ण है कि कौन से उदाहरण वास्तव में एक सहज पढ़ने के अनुभव को बनाए रखने के लिए भाषा स्विच से लाभान्वित होते हैं।

कब और कैसे भाषाओं को स्विच करें

हर विदेशी शब्द को भाषा टैग की आवश्यकता नहीं है। उचित नाम, तकनीकी शर्तें, या वे जो आमतौर पर अंग्रेजी में उपयोग की जाती हैं - जैसे "piñata" या "Los Angeles" - आमतौर पर संदर्भ में समझे जाते हैं और उच्चारण परिवर्तन की आवश्यकता नहीं होती है। हालांकि, दूसरी भाषा में पूर्ण वाक्यांश, वाक्य, या अनुच्छेद को हमेशा WCAG स्तर AA मानकों को पूरा करने के लिए चिह्नित किया जाना चाहिए।

संक्षिप्त विदेशी शब्दों, जैसे नाम, को टैग करने से बचें, क्योंकि यह ब्रेल डिस्प्ले उपयोगकर्ताओं के लिए अनावश्यक और विघ्नकारी भाषा परिवर्तन का कारण बन सकता है। जहां संभव हो,  जैसे ब्लॉक-स्तरीय तत्वों पर xml:lang लागू करें इनलाइन  टैग की बजाय, क्योंकि यह सहायक उपकरणों के साथ अनुकूलता में सुधार करता है। ISBN या भाग संख्याओं जैसी गैर-भाषाई सामग्री के लिए, कोड zxx का उपयोग करें यह इंगित करने के लिए कि सामग्री किसी भी मानव भाषा में नहीं है।

गैर-लैटिन लिपियां और वर्ण सेट

गैर-लैटिन लिपियों को संभालना डिजिटल प्रकाशनों में सटीक प्रदर्शन और कार्यक्षमता सुनिश्चित करने के लिए आवश्यक है। अरबी, चीनी, हिब्रू, और सिरिलिक जैसी भाषाओं को प्रदर्शन समस्याओं से बचने के लिए सटीक तकनीकी सेटअप की आवश्यकता होती है। लापता फॉन्ट या गलत भाषा कोड "tofu" वर्णों की ओर ले जा सकते हैं - वे निराशाजनक सफेद वर्ग या प्रश्न चिह्न जो तब दिखाई देते हैं जब उपकरणों में आवश्यक फॉन्ट की कमी होती है। इसे संबोधित करने के लिए, EPUB 3 अक्सर इन भाषाओं के लिए एक आवश्यकता है। Apple Books सहित प्रमुख खुदरा विक्रेताओं, चीनी, जापानी, अरबी, हिब्रू, दारी, कुर्द, पश्तो, पंजाबी, सिंधी, ताजिक, उइगुर, और उज़्बेक जैसी भाषाओं के लिए इस मानक को अनिवार्य करते हैं ^[3]। EPUB 3 का मूल यूनिकोड समर्थन इन लेखन प्रणालियों को सटीक रूप से प्रस्तुत करने के लिए आवश्यक है।

गैर-लैटिन लिपियों के लिए फॉन्ट एम्बेड करना

फॉन्ट एम्बेड करना उपकरणों में सुसंगत प्रदर्शन सुनिश्चित करता है। Sigil और Calibre जैसे उपकरण इस प्रक्रिया को सरल बनाते हैं। Sigil के लिए, इन चरणों का पालन करें:

अपनी फॉन्ट फ़ाइल (अधिमानतः .ttf प्रारूप में) को "Fonts" फ़ोल्डर में जोड़ें।
@font-face नियम का उपयोग करके अपनी CSS स्टाइलशीट में फॉन्ट घोषित करें:
```
@font-face {
  src: url(../Fonts/yourfont.ttf);
  font-family: "YourFontName";
}
```
अपनी स्टाइलशीट में सभी font-family संदर्भों को आपने परिभाषित किए गए नाम से बदलें।

Calibre में, आप "Manage fonts" उपकरण का उपयोग करके और "Embed all fonts" का चयन करके इसे स्वचालित कर सकते हैं। द्विभाषी प्रकाशनों के लिए, कम से कम एक लैटिन फॉन्ट और एक गैर-लैटिन फॉन्ट शामिल करें। Adobe Digital Editions (संस्करण 3 या 4.5) जैसे उद्योग-मानक पाठकों में हमेशा अपने EPUB को परीक्षण करें ताकि वर्ण सही तरीके से प्रस्तुत होने की पुष्टि करें।

गैर-लैटिन पाठ को छवियों में परिवर्तित करने से भी बचना महत्वपूर्ण है। ऐसा करने से आपकी सामग्री स्क्रीन रीडर के लिए अप्राप्य हो जाती है और उपयोगकर्ताओं को पाठ को पुनः आकार देने से रोकता है, जो पहुंच में बाधा डाल सकता है।

फॉन्ट ओब्फस्केशन पर एक नोट: SHA-1 एल्गोरिथम, जो वर्तमान में EPUBs में फॉन्ट ओब्फस्केशन के लिए उपयोग किया जाता है, को चरणबद्ध किया जा रहा है। W3C पब्लिशिंग रखरखाव कार्य समूह के अनुसार:

NIST सलाह दे रहा है कि SHA-1 एल्गोरिथम [fips-180-4] का उपयोग 2030 के अंत तक चरणबद्ध किया जाए। पब्लिशिंग रखरखाव कार्य समूह SHA-1 पर इसकी निर्भरता के कारण उस तारीख के बाद EPUB प्रकाशनों में फॉन्ट ओब्फस्केशन का समर्थन करने का इरादा नहीं रखता है ^[4]।

एक बार फॉन्ट एम्बेड हो जाने के बाद, अगला कदम सार्वभौमिक यूनिकोड समर्थन सुनिश्चित करना है।

यूनिकोड अनुपालन

EPUB 3 को सभी पढ़ने की प्रणालियों में सटीक वर्ण डेटा बनाए रखने के लिए सार्वभौमिक यूनिकोड समर्थन की आवश्यकता है। यह पाठ छवियों की आवश्यकता को समाप्त करता है और पहुंच सुनिश्चित करता है। इस आवश्यकता को पूरा करने के लिए, सभी XHTML और CSS फ़ाइलों को UTF-8 में एन्कोड करें।

अरबी और हिब्रू जैसी दाएं-से-बाएं लिपियों के लिए, टेक्स्ट दिशा को नियंत्रित करने के लिए dir विशेषता का उपयोग करें (उदाहरण के लिए, dir="rtl")। dir="auto" सेट करने से पढ़ने की प्रणालियों को यूनिकोड बिदिरेक्शनल एल्गोरिथम लागू करने की अनुमति मिलती है, जो उचित पाठ प्रवाह सुनिश्चित करता है।

लिपि/भाषा	सामान्य विरासत एन्कोडिंग	यूनिकोड मानक
अरबी	ISO-8859-6, Windows-1256	UTF-8 / UTF-16
सिरिलिक	ISO-8859-5, Windows-1251	UTF-8 / UTF-16
हिब्रू	ISO-8859-8, Windows-1255	UTF-8 / UTF-16
चीनी (सरलीकृत)	GB2312, GB18030