ಯುನಿಕೋಡ್ : ಏಕೆ? ಹೇಗೆ? ~ ಇಜ್ಞಾನ ಶಿಕ್ಷಣ ಮಿತ್ರ

'ಕಂಪ್ಯೂಟರ್ ಮತ್ತು ಕನ್ನಡ' ಕೃತಿಯಿಂದ ಆಯ್ದ ಅಧ್ಯಾಯ

ಡಾ|| ಯು.ಬಿ.ಪವನಜ

ಯುನಿಕೋಡ್ ಎಂಬುದು ಒಂದು ಸಂಕೇತೀಕರಣದ ಶಿಷ್ಟತೆ. ಗಣಕದಲ್ಲಿ ಯಾವುದೇ ಅಕ್ಷರವನ್ನೂ ಸಂಗ್ರಹಿಸಿಡುವುದು ಅಂಕೆಗಳ ಮೂಲಕ. ಪ್ರಪಂಚದ ಎಲ್ಲ ಭಾಷೆಗಳ ಎಲ್ಲ ಅಕ್ಷರಕ್ಕೂ ತನ್ನದೇ ಆದ ಒಂದು ವಿಶಿಷ್ಟ ಮತ್ತು ಏಕಮಾತ್ರ ಸಂಖ್ಯೆಯ ಮೂಲಕ ಸಂಕೇತೀಕರಣ ಮಾಡುವ ವಿಧಾನವೇ ಯುನಿಕೋಡ್.

ಆಸ್ಕಿ ಮತ್ತು ಇಸ್ಕಿ
ಗಣಕದಲ್ಲಿ ಮಾಹಿತಿಯನ್ನು ವ್ಯಕ್ತಪಡಿಸುವುದು ವಿದ್ಯುತ್ತಿನ ಸ್ಥಿತಿಯ ಮೂಲಕ. ವಿದ್ಯುತ್ತಿಗೆ ಎರಡೇ ಸಾಧ್ಯತೆಗಳಿರುವುದು -ಇದೆ ಅಥವಾ ಇಲ್ಲ. ವಿದ್ಯುತ್ ಇದೆ ಎಂದರೆ `ಒಂದು', ಇಲ್ಲ ಎಂದರೆ `ಸೊನ್ನೆ' ಎಂದು ತೆಗೆದುಕೊಂಡರೆ ಒಂದು ಬಿಟ್‌ನಲ್ಲಿ ೦ ಅಥವಾ ೧ ಅನ್ನು ಸೂಚಿಸಬಹದು. ಅಂದರೆ ಗಣಕದಲ್ಲಿ ಮೂಲತಃ ಎರಡೇ ಅಂಕೆಗಳನ್ನು ಬಿಂಬಿಸುವ ಸಾಧ್ಯತೆಗಳಿರುವುದು. ಗಣಕದಲ್ಲಿ ಮಾಹಿತಿ ಸಂಗ್ರಹಣೆಯ ಸಂಕೇತೀಕರಣಕ್ಕೆ ಬಳಸುವ ಹಳೆಯ ಶಿಷ್ಟತೆ ಆಸ್ಕಿ (ASCII, American Standards Code for Information Interchange). ಆಸ್ಕಿ ೮ ಬಿಟ್‌ಗಳನ್ನು ಹೊಂದಿದೆ. ಗಣಕದಲ್ಲಿ ಮಾಹಿತಿಯ ಒಂದು ತುಣಕೇ ಬಿಟ್ (bit, binary digit). ಒಂದು ಅಕ್ಷರವನ್ನು ಶೇಖರಿಸಲು ಎರಡು ಬಿಟ್‌ಗಳನ್ನು ತೆಗೆದುಕೊಂಡರೆ ಒಟ್ಟು ನಾಲ್ಕು ಸಾಧ್ಯತೆಗಳಿವೆ -೦೦, ೦೧, ೧೦ ಮತ್ತು ೧೧ (ದ್ವಿಮಾನ). ಇವು ದಶಮಾನ ಪದ್ಧತಿಯಲ್ಲಿ ೦, ೧, ೨, ೩ ಆಗುತ್ತವೆ. ಆಸ್ಕಿ ಮತ್ತು ಇಸ್ಕಿಗಳು ೮ ಬಿಟ್‌ಗಳನ್ನು ಬಳಸುತ್ತವೆ. ೮ ಬಿಟ್‌ಗಳನ್ನು ಬಳಸುವ ಯಾವುದೇ ಸಂಕೇತೀಕರಣ ವಿಧಾನವು ೨೫೬ (೨^೮ = ೨೫೬) ಅಕ್ಷರಗಳನ್ನು ಮಾತ್ರವೇ ಹೊಂದಿರಬಲ್ಲುದು. ಇಷ್ಟು ಸ್ಥಾನ ಇಂಗ್ಲಿಷ್ ಮತ್ತು ಯುರೋಪಿಯನ್ ಭಾಷೆಗಳಿಗೆ ಸಾಕು. ಇಂಗ್ಲಿಷ್ ಭಾಷೆಯಲ್ಲಿ ಮೂಲಾಕ್ಷರಗಳನ್ನು ಒಂದರ ಪಕ್ಕ ಒಂದು ಒಂದು ಬರೆದರೆ ಸಾಕು, ಪದಗಳು, ವಾಕ್ಯಗಳು ತಯಾರಾಗುತ್ತವೆ.

ಕನ್ನಡ ಭಾಷೆಯಲ್ಲಿ ಮೂಲಾಕ್ಷರಗಳಿಂದ ಗುಣಿತಾಕ್ಷರಗಳನ್ನು ಮಾಡುವಾಗ ಅವುಗಳ ರೂಪ ಬದಲಾವಣೆ ಆಗುತ್ತದೆ. ಉದಾಹರಣೆಗೆ ಇಂಗ್ಲಿಷಿನಲಿ s,h,r,i, ಸೇರಿ shri ಆಗುತ್ತದೆ. ಅಂದರೆ ಅಕ್ಷರಗಳನ್ನು ಪಕ್ಕಪಕ್ಕ ಜೋಡಿಸಿ ಬರೆದರೆ ಮುಗಿಯಿತು. ಆದರೆ ಕನ್ನಡದಲ್ಲಿ ಶ್, ರ್, ಈ ಸೇರಿ ಶ್ರೀ ಆದಾಗ ಅದರ ರೂಪ ಬದಲಾವಣೆ ಆಗುತ್ತದೆ.

ಗಣಕದ ಮೂಲ ಭಾಷೆ ಕನ್ನಡವೂ ಅಲ್ಲ, ಇಂಗ್ಲೀಷ್ ಅಂತು ಅಲ್ಲವೇ ಅಲ್ಲ. ಗಣಕವು ಆಂತರಿಕವಾಗಿ ಬಳಸುವ ಭಾಷೆ ಒಂದು ಮತ್ತು ಸೊನ್ನೆ. ಆದುದರಿಂದಲೇ ಗಣಕಕ್ಕೆ ಡಿಜಿಟಲ್ ಕಂಪ್ಯೂಟರ್ ಎಂಬ ಹೆಸರಿರುವುದು. ಇಂಗ್ಲೀಷ್ ಭಾಷೆಯ 'k' ಆಗಲಿ, ಕನ್ನಡದ 'ಕ' ಆಗಲಿ, ಕೊನೆಗೆ ಅಂಕೆಗಳಾಗಿ ಮಾರ್ಪಟ್ಟು ಗಣಕದಲ್ಲಿ ಶೇಖರಣೆಗೊಳ್ಳುತ್ತವೆ. ಇಂಗ್ಲೀಷ್ ಭಾಷೆ ಮತ್ತು ಭಾರತೀಯ ಭಾಷೆಗಳನ್ನು ಗಣಕದಲ್ಲಿ ಬಳಸುವಲ್ಲಿ ಒಂದು ಮುಖ್ಯ ವ್ಯತ್ಯಾಸವಿದೆ. ಇಂಗ್ಲೀಷಿನ ಯಾವುದೇ ಅಕ್ಷರವನ್ನು ತೆಗೆದುಕೊಳ್ಳಿ. ಅದನ್ನು ಗಣಕದಲ್ಲಿ ಸಂಗ್ರಹಿಸಿಡಲು ಮತ್ತು ತೋರಿಸಲು ಒಂದೇ ಸಂಕೇತ ಸಾಕಾಗುತ್ತದೆ. ಭಾರತೀಯ ಭಾಷೆಗಳ ಪರಿಸ್ಥಿತಿ ಬೇರೆ. 'ಕ' ಎನ್ನುವ ಅಕ್ಷರವನ್ನು ಸಂಗ್ರಹಿಸಿಡಲು ಒಂದು ಸಂಕೇತ ಸಾಕು. ಆದರೆ 'ಕ' ಎಂಬ (ಅಕ್ಷರದ) ಚಿತ್ರ ಮೂಡಿಬರಲು ಮೂಲ ಅಕ್ಷರ ಮತ್ತು ತಲೆಕಟ್ಟು ಎಂಬ ಎರಡು ಅಕ್ಷರಭಾಗಗಳ (glyph) ಜೋಡಣೆಯಾಗಬೇಕು. ಈ ಅಕ್ಷರಭಾಗಗಳು ಒಟ್ಟು ಸೇರಿ ಅಕ್ಷರಶೈಲಿ (font) ಆಗುತ್ತದೆ. ಇಂಗ್ಲೀಷ್ ಭಾಷೆಗೆ ಈ ಸಮಸ್ಯೆ ಇಲ್ಲ. 'k' ಎನ್ನುವ ಅಕ್ಷರವನ್ನು ಸಂಗ್ರಹಿಸಿಡಲು ಒಂದು ಸಂಕೇತಾಕ್ಷರ ಸಾಕು. ಇದನ್ನು ತೋರಿಸಲು ಒಂದು ಅಕ್ಷರಭಾಗ ಸಾಕು. ಆದುದರಿಂದ ಇಂಗ್ಲೀಷ್ ಭಾಷೆಯಲ್ಲಿ ಸಂಗ್ರಹಣೆಯ ಸಂಕೇತ ಮತ್ತು ಅಕ್ಷರಶೈಲಿಯ ಅಕ್ಷರಭಾಗಗಳ ಸಂಕೇತ ಒಂದೇ ಆಗಿರುತ್ತದೆ. ಇವೆಲ್ಲ ಟ್ರೂಟೈಪ್ ಫಾಂಟ್‌ಗಳಿಗೆ ಅನ್ವಯವಾಗುವಂತಹವು. ಅದರ ಬಗ್ಗೆ ಮುಂದೆ ವಿವರಿಸಲಾಗಿದೆ.

ಗ್ಲಿಫ್ ಎಂದರೇನು? ಫಾಂಟ್ ಎಂದರೇನು?? ಯಾವ ಕೀಲಿ ಒತ್ತಿದಾಗ ಯಾವ ಅಕ್ಷರ ಮೂಡಿಸಬೇಕೆಂದು ಕಂಪ್ಯೂಟರಿಗೆ ಗೊತ್ತಾಗುವುದು ಹೇಗೆ??? ಈ ಕುರಿತು ಟಿ. ಜಿ. ಶ್ರೀನಿಧಿ ಬರೆದಿರುವ, ಇಜ್ಞಾನ ಡಾಟ್ ಕಾಮ್ ಪ್ರಕಟಿಸಿರುವ ವಿಶೇಷ ಲೇಖನಗಳನ್ನು ಇಲ್ಲಿ ಓದಬಹುದು: ಫಾಂಟ್ ಫಂಡಾ! | ಕೀಬೋರ್ಡ್ ಕತೆ

ಕನ್ನಡ ಮತ್ತು ಇತರೆ ಭಾರತೀಯ ಭಾಷೆಗಳಿಗೆ ಎರಡು ರೀತಿಯ ಸಂಕೇತಗಳು ಬೇಕು. ಸಂಗ್ರಹಣೆಗೆ ಒಂದು, ತೋರಿಕೆಗೆ ಇನ್ನೊಂದು. ಮಾಹಿತಿ ಸಂಗ್ರಹಣೆಗೆ ಭಾರತೀಯ ಭಾಷೆಗಳಿಗೆ ಒಂದು ಶಿಷ್ಟತೆ ಇದೆ. ಇದನ್ನು ಸಿದ್ಧಪಡಿಸಿ ಕಾನೂನುಬದ್ಧಗೊಳಿಸಿದವರು ಕೇಂದ್ರ ಸರಕಾರದವರು. ಇದನ್ನು ಇಸ್ಕಿ (ISCII, Indian Script Code for Information Interchange) ಎಂದು ಕರೆಯುತ್ತಾರೆ.

ಇಸ್ಕಿ ಬಳಸಿದಾಗ ಸಂಗ್ರಹಕ್ಕೆ ಒಂದು ಸಂಕೇತ, ತೋರಿಕೆಗೆ ಇನ್ನೊಂದು ಸಂಕೇತ ಬಳಸಬೇಕಾಗುತ್ತದೆ.

ಕನ್ನಡ ಭಾಷೆಯಲ್ಲಿ ೪೯ ಅಕ್ಷರಗಳಿವೆ. ಜೊತೆಗೆ ಸ್ವರ ಚಿಹ್ನೆಗಳಿವೆ. ಇಂಗ್ಲೀಷ್ ಭಾಷೆಯಲ್ಲಿ ೨೬ (ಮತ್ತು ೨೬) ಅಕ್ಷರಗಳಿವೆ. ಬರೆವಣಿಗೆಯ ಚಿಹ್ನೆ, ಅಂಕೆ, ಇತ್ಯಾದಿಗಳೆಲ್ಲ ಒಟ್ಟು ಸೇರಿದರೂ ೨೫೬ಕ್ಕಿಂತ ಕಡಿಮೆಯೇ. ಹಾಗಿದ್ದಲ್ಲಿ ೨೫೬ ಸಂಕೇತಗಳು ಸಾಕಲ್ಲವೇ? ಇಸ್ಕಿಯಲ್ಲಿ ಮಾಹಿತಿಯನ್ನು ಸಂಗ್ರಹಿಸುವಾಗ ಇಂಗ್ಲೀಷ್ ಮತ್ತು ಒಂದು ಭಾರತೀಯ ಭಾಷೆಯನ್ನು ಬಳಸಬಹುದು. ಅಂದರೆ ಕನ್ನಡ, ಹಿಂದಿ, ತಮಿಳು, ತೆಲುಗು, ಹೀಗೆ ಹಲವು ಭಾಷೆಗಳನ್ನು ಒಂದೇ ಕಡತದಲ್ಲಿ ಸಂಗ್ರಹಿಸುವುದು ಅಸಾಧ್ಯ.

ಇಸ್ಕಿಯಲ್ಲಿ ಭಾರತದ ಎಲ್ಲ ಭಾಷೆಗಳಿಗೆ ಒಂದೇ ಸಂಕೇತ ನೀಡಲಾಗಿದೆ. ಅಂದರೆ ಕನ್ನಡದ 'ಕ' ಮತ್ತು ಹಿಂದಿಯ 'ಕ' ಎರಡಕ್ಕೂ ಒಂದೇ ಸಂಕೇತ ಇದೆ. ಇದರಿಂದ ಕೆಲವೊಮ್ಮೆ ಲಾಭವೂ ಇದೆ. ಒಂದು ಟೆಲಿಫೋನ್ ಡೈರೆಕ್ಟರಿಯನ್ನು ಕನ್ನಡ ಮತ್ತು ಹಿಂದಿ ಭಾಷೆಯಲ್ಲಿ ತಯಾರಿಸಬೇಕಾದರೆ, ಕನ್ನಡದಲ್ಲಿ ಬೆರಳಚ್ಚು ಮಾಡಿ, ಇಸ್ಕಿಯಲ್ಲಿ ಶೇಖರಿಸಿ, ಅದನ್ನು ಹಿಂದಿಯ ಫಾಂಟ್‌ನ ಸಂಕೇತಗಳಿಗೆ ಪರಿವರ್ತಿಸಿದರೆ ಸಾಕು. ಆದರೆ ಸಮಸ್ಯೆ ಇರುವುದು ಅಕಾರಾದಿ ವಿಂಗಡಣೆಯಲ್ಲಿ. ಕನ್ನಡ, ತೆಲುಗು, ಮರಾಠಿ, ಹಿಂದಿ, ಹೀಗೆ ಎಲ್ಲ ಭಾಷೆಗಳಿಗೂ ಒಂದೆ ಅಕಾರಾದಿ ವಿಂಗಡಣೆಯ ಸೂತ್ರ ಕಲ್ಪಿಸಲಾಗಿದೆ. ಕನ್ನಡ ಮತ್ತು ಹಿಂದಿಯ ಸೂತ್ರ ಒಂದೇ ಆಗಿರಬೇಕಾಗಿಲ್ಲ. ಉದಾಹರಣೆಗೆ ಇಸ್ಕಿಯಲ್ಲಿರುವ ಅಕಾರಾದಿ ವಿಂಗಡಣೆ -`ಯ, ರ ಲ, ಳ, ವ, ಶ, ಷ, ಸ, ಹ'. ಕನ್ನಡದಲ್ಲಿ ಇದು 'ಯ, ರ, ಲ, ವ, ಶ, ಷ, ಸ, ಹ, ಳ' ಆಗಬೇಕು.

ವಿಶೇಷ ಲೇಖನ: ಕನ್ನಡ ಮತ್ತು ಮಾಹಿತಿ ತಂತ್ರಜ್ಞಾನ -ಅಂದು, ಇಂದು, ಮುಂದು

ಯುನಿಕೋಡ್
ಪ್ರಪಂಚದ ಮಟ್ಟಿಗೆ ಹೇಳುವುದಾದರೆ ಭಾರತೀಯ ಭಾಷೆಗಳ ಜೊತೆ, ಚೀನಾ, ಜಪಾನ್, ಅರೇಬಿ, ಯುರೋಪಿನ ಭಾಷೆಗಳು, ಹೀಗೆ ನೂರಾರು ಭಾಷೆಗಳಿಗೆ ಸ್ಥಾನ ಕಲ್ಪಿಸಿ ಕೊಡಬೇಕಾಗುತ್ತದೆ. ಇದಕ್ಕೆಲ್ಲ ಮದ್ದೆಂದರೆ ೮ ಬಿಟ್‌ಗಳ ಸಂಕೇತೀಕರಣದ ಬದಲಿಗೆ ೧೬ ಬಿಟ್‌ಗಳನ್ನು ಬಳಸುವುದು. ೧೬ ಬಿಟ್‌ಗಳನ್ನು ಬಳಸುವುದರಿಂದ ಸುಮಾರು ೬೫,೦೦೦ ಮೂಲಾಕ್ಷರಗಳಿಗೆ ಜಾಗ ಮಾಡಿಕೊಟ್ಟಂತಾಗುತ್ತದೆ. ಇದು ಪ್ರಪಂಚದ ಬಹುತೇಕ ಭಾಷೆಗಳಿಗೆ ಸಾಕು. ಇದುವೇ ಯುನಿಕೋಡ್ (unicode). ಯುನಿಕೋಡ್ ಎಂಬುದು universal, uniform, unique ಮತ್ತು code (ಸಂಕೇತ) ಎಂಬ ಪದಗಳನ್ನು ಸೂಚಿಸುತ್ತದೆ.

ಪ್ರಪಂಚಕ್ಕೆಲ್ಲಾ ಒಂದೇ ಸಂಕೇತ ವಿಧಾನ ಇರತಕ್ಕದ್ದು. ಪ್ರಪಂಚದ ಪ್ರತಿ ಭಾಷೆಯ ಪ್ರತಿಯೊಂದು ಅಕ್ಷರಕ್ಕೂ ತನ್ನದೇ ಆದ ಪ್ರತ್ಯೇಕ ಸಂಕೇತ ಇರಬೇಕು. ಈ ಎಲ್ಲ ಬೇಕುಗಳಿಗೆ ಉತ್ತರವೇ ಯುನಿಕೋಡ್. ಯುನಿಕೋಡ್‌ನಲ್ಲಿ ಪ್ರತಿ ಭಾಷೆಗೂ ತನ್ನದೇ ಆದ ಸಂಕೇತಶ್ರೇಣಿ ಇದೆ. ಇದು ಭಾರತೀಯ ಭಾಷೆಗಳಿಗೂ ಅನ್ವಯಿಸುತ್ತದೆ. ಯುನಿಕೋಡ್ ವಿಧಾನದಲ್ಲಿ ಮಾಹಿತಿ ಸಂಗ್ರಹಣೆ ಮಾಡಿದರೆ ಒಂದೇ ಕಡತದಲ್ಲಿ ಪ್ರಪಂಚದ ಎಲ್ಲ ಭಾಷೆಗಳಲ್ಲಿ ಮಾಹಿತಿಯನ್ನು ಶೇಖರಣೆ ಮಾಡಲು ಸಾಧ್ಯ. ಗ್ರಂಥಾಲಯವೊಂದರಲ್ಲಿ ಭಾರತದ ಎಲ್ಲ ಭಾಷೆಯ ಪುಸ್ತಕಗಳಿದ್ದಲ್ಲಿ ಅವುಗಳ ವಿವರಗಳ ದತ್ತಸಂಚಯ (database) ತಯಾರಿಸಬೇಕಾದರೆ ಯುನಿಕೋಡ್ ವಿಧಾನದಿಂದ ಮಾತ್ರ ಸಾಧ್ಯ.

ಯುನಿಕೋಡ್‌ನಲ್ಲಿ ಭಾರತದ ಎಲ್ಲ ಭಾಷೆಯ ಎಲ್ಲ ಮೂಲಾಕ್ಷರಗಳಿಗೂ ತನ್ನದೇ ಆದ ಏಕಮಾತ್ರ (unique) ಸಂಕೇತ ಇದೆ. ಉದಾಹರಣೆಗೆ ಕನ್ನಡದ 'ಅ' ಅಕ್ಷರದ ಯುನಿಕೋಡ್ ಸಂಕೇತ C೮೫ (hexadecimal) ಅಥವಾ ಅದನ್ನೇ ದಶಮಾನ ಪದ್ಧತಿಯಲ್ಲಿ ಬರೆದರೆ ೩೨೦೫ ಆಗುತ್ತದೆ. ಕನ್ನಡದ ಯುನಿಕೋಡ್ ಕೋಷ್ಟಕವನ್ನು ಅನುಬಂಧದಲ್ಲಿ ನೀಡಲಾಗಿದೆ. ಭಾರತದ ಎಲ್ಲ ಭಾಷೆಗಳನ್ನೂ ಯುನಿಕೋಡ್‌ನಲ್ಲಿ ೧೨೮ ರಷ್ಟು ಅಂತರದಲ್ಲಿ ಇಡಲಾಗಿದೆ. ಅಂದರೆ ಕನ್ನಡದ 'ಅ' ಅಕ್ಷರದ ಯುನಿಕೋಡ್ ಸಂಕೇತ ೩೨೦೫ ಕ್ಕೆ ೧೨೮ ಸೇರಿಸಿದರೆ ಮುಂದಿನ ಭಾಷೆ ಮಲಯಾಳಂನ 'ಅ' ದೊರೆಯುತ್ತದೆ. ಅದರ ಯುನಿಕೋಡ್ ಸಂಕೇತ ೩೩೩೩. ಈ ಸೂತ್ರವನ್ನು ಬಳಸಿ ಭಾರತದ ಎಲ್ಲ ಭಾಷೆಗಳ ನಡುವೆ ಸುಲಭವಾಗಿ ಲಿಪ್ಯಂತರಣ ಮಾಡಬಹುದು. ಭಾರತೀಯ ರೈಲ್ವೆಯವರು ತಮ್ಮ ಜಾಲತಾಣದಲ್ಲಿ ರೈಲು ಮತ್ತು ನಿಲ್ದಾಣಗಳ ಹೆಸರುಗಳನ್ನು ಎಲ್ಲ ಭಾಷೆಗಳಲ್ಲಿ ಯುನಿಕೋಡ್ ಬಳಸಿ ಭಾಷೆಗಳ ನಡುವೆ ಲಿಪ್ಯಂತರಣದ ಮೂಲಕ ಮೂಡಿಸಬಹುದು.

ಯುನಿಕೋಡ್‌ನಲ್ಲಿ ಅಕ್ಷರಗಳ ಕೋಷ್ಟಕ ಮತ್ತು ಅಕಾರಾದಿ ವಿಂಗಡಣೆಯ ಕೋಷ್ಟಕ ಬೇರೆ ಬೇರೆ ಇವೆ. ಅಂದರೆ ಮೂಲಾಕ್ಷರಗಳ ಕೋಷ್ಟಕದಲ್ಲಿ ಇರುವ ವಿಧಾನದಲ್ಲಿ ಅಕಾರಾದಿ ವಿಂಗಡಣೆ ಆಗಬೇಕಾಗಿಲ್ಲ. ಕನ್ನಡದ ಯುನಿಕೋಡ್ ಕೋಷ್ಟಕದಲ್ಲಿ ಲ,ಳ,ವ,ಶ,ಷ, ಎಂದೇ ಅಕ್ಷರಗಳನ್ನು ಜೋಡಿಸಲಾಗಿದೆ. ಆದರೆ ಕನ್ನಡ ಅಕಾರಾದಿ ವಿಂಗಡಣೆಯ ಕೋಷ್ಟಕದಲ್ಲಿ ವಿಂಗಡಣೆಯ ಸೂತ್ರ ಸರಿಯಾಗಿದೆ.

ಇಸ್ಕಿಯಲ್ಲಿ ಇಂಗ್ಲಿಷ್ ಜೊತೆ ಯಾವುದಾದರೂ ಒಂದು ಭಾರತೀಯ ಭಾಷೆಯನ್ನು ಮಾತ್ರ ಸೇರಿಸಿಕೊಳ್ಳಬಹುದು. ಯುನಿಕೋಡ್‌ನಲ್ಲಿ ಪ್ರಪಂಚದ ಎಲ್ಲ ಭಾಷೆಗಳನ್ನೂ ಒಟ್ಟಿಗೆ ಬಳಸಬಹುದು.

ಯುನಿಕೋಡ್ ಅಲ್ಲದ ಹಳೆಯ ವಿಧಾನದಲ್ಲಿ ಕನ್ನಡದ ಮಾಹಿತಿಯನ್ನು ಅಕ್ಷರಭಾಗಗಳಾಗಿ, ಅಂದರೆ ಅಕ್ಷರಭಾಗಗಳ ಆಸ್ಕಿ ಸಂಕೇತಗಳಾಗಿ ಸಂಗ್ರಹಿಸಿಡುವುದರಿಂದ ಗಣಕಕ್ಕೆ ಅವು ಕನ್ನಡದ ಮಾಹಿತಿ ಎಂದು ತಿಳಿಯುವುದಿಲ್ಲ. 'ಕ' ಎನ್ನುವ ಅಕ್ಷರವನ್ನೂ ಮೂಲ ಅಕ್ಷರ ಮತ್ತು ತಲೆಕಟ್ಟು ಎನ್ನುವ ಎರಡು ತುಂಡುಗಳಾಗಿ ಸಂಗ್ರಹಿಸಿಡಲಾಗುತ್ತದೆ. ಇದರಿಂದಾಗಿ ಅದು ಗಣಕಕ್ಕೆ 'ಕ' ಎಂದು ತಿಳಿಯುವುದಿಲ್ಲ. ಆದುದರಿಂದ ಇಂತಹ ಮಾಹಿತಿಯನ್ನು ಅಕಾರಾದಿಯಾಗಿ ವಿಂಗಡಿಸಲು ಆಗುವುದಿಲ್ಲ. ಯುನಿಕೋಡ್‌ನಲ್ಲಿ ಈ ಸಮಸ್ಯೆ ಇಲ್ಲ. ಅಕ್ಷರಗಳನ್ನು ಅವುಗಳ ಯುನಿಕೋಡ್ ಸಂಕೇತವಾಗಿ ಸಂಗ್ರಹಿಸಿಡಲಾಗುತ್ತದೆ. ಅವುಗಳನ್ನು ಕನ್ನಡದ ಅಕಾರಾದಿ ವಿಂಗಡಣೆಯ ಸೂತ್ರದನ್ವಯ ವಿಂಗಡಣೆ ಮಾಡಬಹುದು.

ಅಂತರಜಾಲದಲ್ಲಿ, ಗೂಗಲ್‌ನಲ್ಲಿ, ಫೇಸ್‌ಬುಕ್, ಟ್ವಿಟ್ಟರ್, ಬ್ಲಾಗಿಂಗ್‌ಗಳಲ್ಲಿ ಬಳಕೆಯಾಗುವುದು ಕನ್ನಡದ ಯುನಿಕೋಡ್ ವಿಧಾನ. ಕನ್ನಡದ ಜಾಲತಾಣವೊಂದನ್ನು ಕನ್ನಡ ಯುನಿಕೋಡ್‌ನಲ್ಲಿ ನಿರ್ಮಿಸಿದರೆ ಅದು ಗೂಗಲ್‌ನ ಹುಡುಕುವಿಕೆಯ ಫಲಿತಾಂಶದಲ್ಲಿ ಕಂಡುಬುರುತ್ತದೆ. ಹಳೆಯ ಯುನಿಕೋಡ್ ಅಲ್ಲದ ವಿಧಾನದಲ್ಲಿ ಜಾಲತಾಣ ನಿರ್ಮಿಸಿದರೆ ಗೂಗಲ್ ಅಥವಾ ಇನ್ಯಾವುದೇ ಜಾಲಶೋಧಕದಲ್ಲಿ ಅದು ಕಂಡುಬರುವುದಿಲ್ಲ. ಕನ್ನಡದಲ್ಲಿ ೬ ಸಾವಿರದಷ್ಟು ಜನ ಬ್ಲಾಗಿಗರು ಇದ್ದಾರೆ. ಅವರು ಬ್ಲಾಗ್ ಮಾಡಲು ಬಳಸುವುದು ಕನ್ನಡ ಯುನಿಕೋಡನ್ನೇ. ಫೇಸ್‌ಬುಕ್‌ನಲ್ಲಿ ವ್ಯವಹರಿಸಲೂ ಕನ್ನಡ ಯುನಿಕೋಡ್‌ನಿಂದಾಗಿ ಮಾತ್ರ ಸಾಧ್ಯ. ಜಗತ್ತಿನ ಸುಪ್ರಸಿದ್ಧ ಸ್ವತಂತ್ರ ಮತ್ತು ಮುಕ್ತ ವಿಶ್ವಕೋಶ ವಿಕಿಪೀಡಿಯದ ಕನ್ನಡ ಆವೃತ್ತಿ ಸಾಧ್ಯವಾಗಿರುವುದು ಯುನಿಕೋಡ್‌ನಿಂದ. ದತ್ತಸಂಚಯಾಧಾರಿತ ತಂತ್ರಾಂಶ ತಯಾರಿಯಲ್ಲೂ ಬಳಕೆಯಾಗುವುದು ಯುನಿಕೋಡ್. ಉದಾಹರಣೆಗೆ ಕರ್ನಾಟಕ ಸರಕಾರದ ಪಡಿತರ ಚೀಟಿ ತಂತ್ರಾಂಶ. ಇದರಲ್ಲಿ ಎಲ್ಲ ನಾಗರಿಕರ ಹೆಸರು ಮತ್ತು ಇತರೆ ವಿವರಗಳು ಕನ್ನಡ ಯುನಿಕೋಡ್ ಸಂಕೇತೀಕರಣದ ಮೂಲಕ ಗಣಕದಲ್ಲಿ ಶೇಖರಣೆಯಾಗಿರುತ್ತವೆ. ಇದರಿಂದಾಗಿ ಹೆಸರು ನಮೂದಿಸಿದರೆ ವ್ಯಕ್ತಿಯ ಸಮಗ್ರ ವಿವರ ಹಡುಕುವುದು ಸಾಧ್ಯವಾಗುತ್ತದೆ.

ಯುನಿಕೋಡ್ ಬಳಕೆಯಿಂದ ಇನ್ನೂ ಒಂದು ಪ್ರಮುಖ ಸಾಧಕವಿದೆ. ಕನ್ನಡದ ಮಾಹಿತಿಯನ್ನು (ಪಠ್ಯ, ದತ್ತಸಂಚಯ, ಇತ್ಯಾದಿ) ಯುನಿಕೋಡ್ ವಿಧಾನದಲ್ಲಿ ಒಂದು ಗಣಕದಲ್ಲಿ ತಯಾರಿಸಿದರೆ ಅದನ್ನು ಪ್ರಪಂಚದ ಇತರೆ ಯಾವ ಗಣಕದಲ್ಲೂ ಬಳಸಬಹುದು. ಯುನಿಕೋಡ್ ಅಲ್ಲದ ವಿಧಾನದಲ್ಲಿ (ನುಡಿ, ಬರಹ, ಆಕೃತಿ, ಶ್ರೀಲಿಪಿ, ಇತ್ಯಾದಿ) ಮಾಹಿತಿ ತಯಾರಿಸಿದರೆ ಅದನ್ನು ಇನ್ನೊಂದು ಗಣಕದಲ್ಲಿ ತೆರೆಯಬೇಕಾದರೆ ಅದೇ ತಂತ್ರಾಂಶ ಆ ಗಣಕದಲ್ಲಿ ಇರುವ ಅಗತ್ಯವಿದೆ. ಯುನಿಕೋಡ್‌ನಲ್ಲಿ ಮಾಹಿತಿ ತಯಾರಿಸಿದರೆ ಒಂದು ಕಾರ್ಯಾಚರಣ ವ್ಯವಸ್ಥೆಯನ್ನು ಬಳಸುವ ಗಣಕದಿಂದ ಇನ್ನೊಂದು ಕಾರ್ಯಾಚರಣ ವ್ಯವಸ್ಥೆಯನ್ನು ಬಳಸುವ ಗಣಕಕ್ಕೆ ವರ್ಗಾಯಿಸಬಹುದು. ಅಂದರೆ ವಿಂಡೋಸ್ ಗಣಕದಲ್ಲಿ ತಯಾರಿಸಿದ ಮಾಹಿತಿಯನ್ನು ಲಿನಕ್ಸ್ ಅಥವಾ ಮ್ಯಾಕ್ ಗಣಕದಲ್ಲಿ ಹಾಗೂ ಸ್ಮಾರ್ಟ್‌ಫೋನ್‌ಗಳಲ್ಲಿ ತೆರೆಯಬಹುದು. ಯುನಿಕೋಡ್ ಅಲ್ಲದ ವಿಧಾನದಲ್ಲಿ ಇದು ಸಾಧ್ಯವಿಲ್ಲ.

ಗಮನಿಸಿ: ಯುನಿಕೋಡ್ ಎನ್ನುವುದು ಗಣಕಗಳಲ್ಲಿ ಮಾಹಿತಿ ಸಂಗ್ರಹಣೆಯ ಒಂದು ಶಿಷ್ಟತೆಯೇ ವಿನಾ ಅದು ಒಂದು ತಂತ್ರಾಂಶವಲ್ಲ.

ಓಪನ್‌ಟೈಪ್ ಫಾಂಟ್
ಆಸ್ಕಿ ಮತ್ತು ಇಸ್ಕಿ ಸಂಕೇತೀಕರಣದ ಜೊತೆ ಬಳಕೆಯಾಗುವುದು ಟ್ರೂಟೈಪ್ ಫಾಂಟ್‌ಗಳು. ಟ್ರೂಟೈಪ್ ಫಾಂಟ್‌ಗಳಲ್ಲಿ ಒಟ್ಟು ಬಳಸಬಹುದಾದ ಅಕ್ಷರಭಾಗಗಳಿಗೆ ಮಿತಿ ಇದೆ. ಇದಕ್ಕೆ ಕಾರಣ ಅವು ಆಸ್ಕಿ ಆಧಾರಿತವಾಗಿದ್ದು ಸುಮಾರು ೧೯೦ರಷ್ಟು ಅಕ್ಷರಭಾಗಗಳನ್ನು ಮಾತ್ರ ಬಳಸಬಲ್ಲವು. ಕನ್ನಡದಲ್ಲಿ ೫೧ ಮೂಲಾಕ್ಷರಗಳಿದ್ದರೂ (ಹಳೆಗನ್ನಡದ ಅಕ್ಷರಗಳೂ ಸೇರಿ) ಅವುಗಳ ಒಟ್ಟು ಗುಣಿತಾಕ್ಷರಗಳ ಸಾಧ್ಯತೆ ೧೫೦೦೦ದಷ್ಟಿದೆ. ಈ ಎಲ್ಲ ಗುಣಿತಾಕ್ಷರಗಳನ್ನು ಟ್ರೂಟೈಪ್ ಫಾಂಟ್‌ಗಳಲ್ಲಿ ಹಲವು ರಾಜಿ ಸೂತ್ರಗಳ ಮೂಲಕ ಮೂಡಿಸಬೇಕಾಗುತ್ತದೆ. ಎರಡು ಮತ್ತು ಹೆಚ್ಚಿನ ಒತ್ತುಗಳ ಸಂದರ್ಭದಲ್ಲಿ ಈ ರಾಜಿ ಹೆಚ್ಚು ವೇದ್ಯವಾಗುತ್ತದೆ.

ಯೂನಿಕೋಡ್‌ವಿಧಾನದಲ್ಲಿ ಸಂಗ್ರಹಿಸಿದ ಮಾಹಿತಿಯನ್ನು ಪರದೆಯಲ್ಲಿ ಪ್ರದರ್ಶಿಸಲು ಬಳಸುವುದು ಓಪನ್‌ಟೈಪ್ ಫಾಂಟ್‌ಗಳನ್ನು. ಈ ಓಪನ್‌ಟೈಪ್ ಫಾಂಟ್‌ಗಳಲ್ಲಿ ಅಕ್ಷರಭಾಗಗಳು (ಗ್ಲಿಫ್) ಮತ್ತು ರೆಂಡರಿಂಗ್ ಸೂತ್ರ ಇರುತ್ತದೆ. ಬೇರೆ ಬೇರೆ ಫಾಂಟ್‌ಗಳಲ್ಲಿ ಒಂದೇ ಮಾಹಿತಿಯನ್ನು ಬೇರೆ ಬೇರೆ ರೂಪದಲ್ಲಿ ಪ್ರದರ್ಶಿಸುವ ಸೌಲಭ್ಯವನ್ನು ಈ ರೀತಿಯಲ್ಲಿ ಪಡೆದುಕೊಳ್ಳಬಹುದು. ಕನ್ನಡದಲ್ಲಿ ಈ ರೀತಿಯ ಉದಾಹರಣೆಗಳು ತುಂಬ ಕಡಿಮೆ. ಒಂದು ಉದಾಹರಣೆಯೆಂದರೆ 'ಎನ್'. ಇದನ್ನು ಅರ್ಕಾವತ್ತಿನಂತೆ ಕಾಣುವ ಚಿಹ್ನೆಯನ್ನು ಬಳಸಿ ಪ್ರತಿನಿಧಿಸುವ ಅಭ್ಯಾಸವೂ ಇದೆ (ಮುಂದಿನ ಚಿತ್ರ ನೋಡಿ). ಸಂಗ್ರಹದಲ್ಲಿ ಎರಡೂ ಒಂದೇ ಆಗಿರುತ್ತವೆ. ಬೇರೆ ಬೇರೆ ಓಪನ್‌ಟೈಪ್ ಫಾಂಟ್‌ಗಳು ಇದನ್ನು ಎರಡು ರೀತಿಯಲ್ಲಿ ಪ್ರದರ್ಶಿಸಬಹುದು. ಫಾಂಟ್‌ನ್ನು ಬದಲಾಯಿಸುವ ಮೂಲಕ ತಮಗೆ ಬೇಕಾದ ಪ್ರದರ್ಶನರೂಪವನ್ನು ಪಡೆದುಕೊಳ್ಳಬಹುದು. ಸಂಗ್ರಹದಲ್ಲಿ ಅವೆರಡೂ ಒಂದೇ ಆಗಿರುವುದರಿಂದ ಮಾಹಿತಿಯನ್ನು ಹುಡುಕುವಾಗ, ವಿಂಗಡಿಸುವಾಗ, ದತ್ತ ಸಂಸ್ಕರಣೆಯಲ್ಲಿ ಎಲ್ಲ ಕಡೆ ಎರಡೂ ಒಂದೇ ಆಗಿ ಪರಿಗಣಿಸಲ್ಪಡುತ್ತವೆ.

ಓಪನ್‌ಟೈಪ್ ಫಾಂಟ್‌ಗಳಲ್ಲಿ ಬಳಸಬಹುದಾದ ಒಟ್ಟು ಅಕ್ಷರಭಾಗಗಳಿಗೆ ಮಿತಿಯಿಲ್ಲ. ಎಷ್ಟು ಬೇಕಾದರೂ ಬಳಸಬಹುದು. ಅಂದರೆ ಎಲ್ಲ ನಮೂನೆಯ ಒತ್ತುಗಳ ವಿಶೇಷ ಸಂದರ್ಭಗಳಿಗೆಂದೇ ವಿಶೇಷ ಅಕ್ಷರಭಾಗಗಳನ್ನು ತಯಾರಿಸಬಹುದು. ಆದುದರಿಂದ ಕನ್ನಡ ಮತ್ತು ಇತರೆ ಭಾರತೀಯ ಭಾಷೆಗಳಿಗೆ ಯೂನಿಕೋಡ್ ಮತ್ತು ಓಪನ್‌ಟೈಪ್ ಫಾಂಟ್ ಸೂಕ್ತವಾಗಿದೆ.

ದತ್ತಸಂಚಯಗಳಲ್ಲಿ ಯುನಿಕೋಡ್
ಪ್ರಪಂಚದ ಎಲ್ಲ ಪ್ರಮುಖ ದತ್ತಸಂಚಯ ತಂತ್ರಾಂಶಗಳಲ್ಲಿ ಯುನಿಕೋಡ್ ಬೆಂಬಲ ಇದೆ. ಅಂದರೆ ಈ ದತ್ತಸಂಚಯ ತಂತ್ರಾಂಶ ಬಳಸಿ ಕನ್ನಡದ ಯುನಿಕೋಡ್ ದತ್ತಸಂಚಯ ತಯಾರಿಸಬಹುದು ಮತ್ತು ಅದನ್ನು ಪ್ರೋಗ್ರಾಮ್ಮಿಂಗ್‌ನಲ್ಲಿ ಬಳಕೆ ಮಾಡಬಹುದು. ಕನ್ನಡ ಯುನಿಕೋಡ್ ಬೆಂಬಲ ಇರುವ ಕೆಲವು ಪ್ರಮುಖ ದತ್ತಸಂಚಯ ತಂತ್ರಾಂಶಗಳು -ಮೈಕ್ರೋಸಾಫ್ಟ್ ಎಸ್‌ಕ್ಯೂಎಲ್ ಸರ್ವರ್, ಒರಾಕಲ್, ಮೈಎಸ್‌ಕ್ಯೂಎಲ್, ಪೋಸ್ಟ್‌ಗ್ರೆಸ್, ಐಬಿಎಂ ಡಿಬಿ೨, ಇತ್ಯಾದಿ.

ದತ್ತಸಂಚಯದ ಜೊತೆ ವ್ಯವಹರಿಸಬೇಕಾದರೆ ಆದೇಶ ನೀಡಲು ಬಳಸುವ ಪ್ರೋಗ್ರಾಮ್ಮಿಂಗ್ ಭಾಷೆಗೆ ಎಸ್‌ಕ್ಯೂಎಲ್ ಎನ್ನುತ್ತಾರೆ. ಈ ಭಾಷೆಯಲ್ಲೂ ಯುನಿಕೋಡ್‌ಗೆ ಬೆಂಬಲ ಇದೆ. ಕರ್ನಾಟಕದ ಎಲ್ಲ ದೂರವಾಣಿ ಬಳಕೆದಾರರ ಹೆಸರುಗಳನ್ನು ದತ್ತಸಂಚಯದಲ್ಲಿ ಶೇಖರಿಸಿ ಅವುಗಳನ್ನು ಕನ್ನಡದ ಅಕರಾದಿಯಾಗಿ ವಿಂಗಡಿಸಿ ನೀಡು ಎಂದು ಎಸ್‌ಕ್ಯೂಎಲ್ ಭಾಷೆಯಲ್ಲಿ ಆದೇಶ ನೀಡಿದರೆ ಅದು ಹಾಗೆಯೇ ಮಾಡಿ ಮಾಹಿತಿ ನೀಡುತ್ತದೆ. ಇದರಿಂದಾಗಿ ಕನ್ನಡದ ಮಾಹಿತಿಯನ್ನು ಕನ್ನಡ ಲಿಪಿಯಲ್ಲೇ ಹುಡುಕಲು ಸಾಧ್ಯವಾಗುತ್ತದೆ. ಕನ್ನಡದ ಸಹಜಭಾಷಾಸಂಸ್ಕರಣೆ ಮಾಡುವುದಿದ್ದರೂ ಕನ್ನಡದ ಪದಗಳನ್ನು ಯುನಿಕೋಡ್ ಬೆಂಬಲಿತ ದತ್ತಸಂಚಯದಲ್ಲಿ ಶೇಖರಿಸಿಯೇ ಮುಂದುವರೆಯಬೇಕು.

ಪದವಿಂಗಡಣೆ ಮಾಡಿ ಕ್ರಮಬದ್ಧವಾಗಿ ಸಂಗ್ರಹಿಸಿದ ಪದಗಳ ಸಂಚಯಕ್ಕೆ ಪಠ್ಯಕಣಜ ಎನ್ನಲಾಗುತ್ತದೆ. ಸಹಜಭಾಷಾಸಂಸ್ಕರಣೆಯಲ್ಲಿ ಇದು ಆರಂಭದ ಹಂತ. ಇದರಲ್ಲಿ ಕನ್ನಡದ ಪದಗಳನ್ನು ಮತ್ತು ಅವುಗಳ ಪದವಿಂಗಡಣೆಯನ್ನು ಸಂಗ್ರಹಿಸಿಡಲಾಗುತ್ತದೆ. ಉದಾಹರಣೆಗೆ ವಿಶ್ವವಿದ್ಯಾಲಯ-ನಾಮಪದ, ರಾಮ-ಅಂಕಿತನಾಮ, ಓಡಿದನು-ಕ್ರಿಯಾಪದ, ಇತ್ಯಾದಿ. ಹೀಗೆ ಸಂಗ್ರಹಿದ ಪಠ್ಯಕಣಜದಿಂದ ನಮಗೆ ಬೇಕಾದ ರೀತಿಯಲ್ಲಿ ಮಾಹಿತಿಯನ್ನು ಜಾಲರಿ ಹಿಡಿದು ತೆಗೆಯಬಹುದು. ಉದಾಹರಣೆಗೆ 'ಸು' ಮತ್ತು 'ಡು' ಅಕ್ಷರಗಳಿಂದ ಕೊನೆಗೊಳ್ಳದ ಎಲ್ಲ ಕ್ರಿಯಾಪದಗಳನ್ನು ಹುಡುಕಿ ತೆಗೆಯುವುದು.

ಓಪನ್‌ಟೈಪ್ ಫಾಂಟ್‌ಗಳಲ್ಲಿ ಯುನಿಕೋಡ್‌ನ ಮೂಲಾಕ್ಷರಗಳನ್ನು ಸಂಯುಕ್ತಾಕ್ಷರವಾಗಿಸಿದಾಗ ಯಾವ ರೀತಿಯಲ್ಲಿ ಪರದೆಯಲ್ಲಿ ತೋರಿಸಬೇಕು ಎಂಬ ಸೂತ್ರ ಅಡಕವಾಗಿರುತ್ತದೆ. ಫಾಂಟ್ ಬದಲಿಸುವ ಮೂಲಕ ಅದೇ ಮಾಹಿತಿಯನ್ನು ಇನ್ನೊಂದು ರೀತಿಯಲ್ಲಿ ತೋರಿಸಬಹುದು.

ಪ್ರೋಗ್ರಾಮ್ಮಿಂಗ್‌ನಲ್ಲಿ ಯುನಿಕೋಡ್
ಈಗ ಬಳಕೆಯಲ್ಲಿರುವ ಎಲ್ಲ ಪ್ರಮುಖ ಪ್ರೋಗ್ರಾಮ್ಮಿಂಗ್ ಭಾಷೆಗಳಲ್ಲಿ ಯುನಿಕೋಡ್ ಮತ್ತು ಕನ್ನಡ ಯುನಿಕೋಡ್ ಬೆಂಬಲ ಇದೆ. ಅಂದರೆ ಕನ್ನಡದ ಮಾಹಿತಿಯನ್ನು ಪ್ರೋಗ್ರಾಮ್ ಮೂಲಕ ಸಂಸ್ಕರಣೆ ಮಾಡಬಹುದು. ಒಂದು ಗ್ರಂಥಾಲಯದಲ್ಲಿರುವ ಎಲ್ಲ ಪುಸ್ತಕಗಳ ಯಾದಿಯನ್ನು ಯುನಿಕೋಡ್ ಬೆಂಬಲಿತ ದತ್ತಸಂಚಯದಲ್ಲಿ ಕನ್ನಡ ಯುನಿಕೋಡ್ ವಿಧಾನದಲ್ಲಿ ಸಂಗ್ರಹಿಸಿಟ್ಟು ನಂತರ ಅದನ್ನು ಯಾವುದಾದರೊಂದು ಪ್ರೋಗ್ರಾಮ್ಮಿಂಗ್ ಭಾಷೆಯ ಮೂಲಕ ನಮಗೆ ಬೇಕಾದ ರೀತಿಯಲ್ಲಿ ಪಡೆಯಬಹುದು ಮತ್ತು ಸಂಸ್ಕರಿಸಬಹುದು. ಉದಾಹರಣೆಗೆ ಶಿವರಾಮ ಕಾರಂತರು ಬರೆದ ಎಲ್ಲ ಕಾದಂಬರಿಗಳ ಯಾದಿ ಪಡೆಯುವುದು. ಪಡಿತರ ಚೀಟಿ ತಂತ್ರಾಂಶ ಕನ್ನಡ ಯುನಿಕೋಡ್ ಪ್ರೋಗ್ರಾಮಿಂಗ್‌ಗೆ ಇನ್ನೊಂದು ಪ್ರಮುಖ ಉದಾಹರಣೆ.

ಪಡಿತರ ಚೀಟಿ ತಂತ್ರಾಂಶದ ಒಂದು ನೋಟ

ಭಾಮಿನಿ ಷಟ್ಪದಿಯಲ್ಲಿ ಬರೆದ ಒಂದು ಕಾವ್ಯವನ್ನು ಪುಸ್ತಕ ರೂಪದಲ್ಲಿ ಮುದ್ರಿಸಬೇಕಾಗಿದೆ. ಭಾಮಿನಿ ಷಟ್ಪದಿಗೆ ಕೆಲವು ಸೂತ್ರಗಳಿವೆ. ಪ್ರತಿ ಸಾಲುಗಳಲ್ಲಿ ಇಂತಿಷ್ಟು ಮಾತ್ರೆಗಳು, ಎರಡನೆ ಅಕ್ಷರ ಪ್ರಾಸ ಇತ್ಯಾದಿ. ಇವುಗಳನ್ನು ಗಣಿತ ಸೂತ್ರಗಳಲ್ಲಿ ಬಿಂಬಿಸಬಹುದು. ಪದ್ಯವನ್ನು ಕನ್ನಡ ಯುನಿಕೋಡ್‌ನಲ್ಲಿ ಊಡಿಸಿ ಅದು ಭಾಮಿನಿ ಛಂದಸ್ಸಿನಲ್ಲಿ ಇದೆಯೇ ಇಲ್ಲವೇ ಎಂದು ತಿಳಿಯಲು ಪ್ರೋಗ್ರಾಮ್ ಬರೆಯಬಹುದು. ಇವು ಒಂದೆರಡು ಉದಾಹರಣೆಗಳು ಮಾತ್ರ. ಸಾಧ್ಯವಿರುವ ಕೆಲಸಗಳು ನೂರಾರಿವೆ.

ಕನ್ನಡ ಯುನಿಕೋಡ್ ಬೆಂಬಲಿತ ಕೆಲವು ಪ್ರೋಗ್ರಾಮ್ಮಿಂಗ್ ಭಾಷೆಗಳು -ಮೈಕ್ರೋಸಾಫ್ಟ್ VB.NET, C#.NET, ಜಾವಾ, ಸಿ, ಸಿ++, ಪೈಥಾನ್, ಪರ್ಲ್, ಪಿಎಚ್‌ಪಿ, ಇತ್ಯಾದಿ.

ಅನುಬಂಧ

ಇಸ್ಕಿ ಕೋಷ್ಟಕ

ಕನ್ನಡ ಯುನಿಕೋಡ್ ೭.೦ ಕೋಷ್ಟಕ

ಪಾರಿಭಾಷಿಕ ಪದಕೋಶ

ಅಂತರಜಾಲ internet
ಅಕ್ಷರಭಾಗ glyph
ಅಕ್ಷರಶೈಲಿ font
ಕಾರ್ಯಾಚರಣ ವ್ಯವಸ್ಥೆ operating system
ಜಾಲಶೋಧಕ search engine
ತಂತ್ರಾಂಶ software
ದತ್ತಸಂಚಯ database
ದತ್ತ ಸಂಸ್ಕರಣೆ data processing
ಪಠ್ಯಕಣಜ text corpus
ಪದವಿಂಗಡಣೆ part-of-speech tagging
ಬಿಟ್ bit (binary digit)
ಬ್ಲಾಗಿಗರು bloggers
ಲಿಪ್ಯಂತರಣ transliteration
ವಿಂಗಡಣೆ sorting
ಸಂಕೇತೀಕರಣ encoding
ಸಹಜ ಭಾಷಾ ಸಂಸ್ಕರಣೆ natural language processing

ಉಪಯುಕ್ತ ಜಾಲತಾಣಗಳು

The Unicode Consortium ಜಾಲತಾಣ | ಯುನಿಕೋಡ್ ಎಂದರೇನು?
ಯುನಿಕೋಡ್ ಕುರಿತ ವಿಕಿಪೀಡಿಯ ಪುಟ: ಕನ್ನಡ | ಇಂಗ್ಲಿಷ್
ಕನ್ನಡದಲ್ಲಿ ಟೈಪಿಂಗ್ ಕುರಿತು ವಿಕಾಸ ಹೆಗಡೆಯವರ ಬ್ಲಾಗ್ ಬರಹ
What is OpenType?

ತಂತ್ರಾಂಶ ಅಭಿವೃದ್ಧಿ, ತಂತ್ರಜ್ಞಾನ ಸಂವಹನ ಸೇರಿದಂತೆ ಹಲವು ಕ್ಷೇತ್ರಗಳಲ್ಲಿ ಕೆಲಸಮಾಡಿರುವ ಡಾ. ಯು. ಬಿ. ಪವನಜ ಪ್ರಸ್ತುತ ಬೆಂಗಳೂರಿನ ಸೆಂಟರ್ ಫಾರ್ ಇಂಟರ್‌ನೆಟ್ ಆಂಡ್ ಸೊಸೈಟಿಯಲ್ಲಿ ಸೇವೆಸಲ್ಲಿಸುತ್ತಿದ್ದಾರೆ. ಕರ್ನಾಟಕ ಸರಕಾರದ ತಂತ್ರಾಂಶ ಸಮಿತಿಯ ಸದಸ್ಯರೂ ಆಗಿರುವ ಪವನಜರ 'ಗ್ಯಾಜೆಟ್ ಲೋಕ' ಅಂಕಣ ಪ್ರಜಾವಾಣಿಯಲ್ಲಿ ಪ್ರಕಟವಾಗುತ್ತಿದೆ.

2 comments:

Harihara Sreenivasa RaoNovember 1, 2014 at 6:09 AM
I am highly thankful for your Kannada Rajyotsava Gift. For the first time I came to understand the usage of Unicode though this article so nicely explained in a simple manner with illustartions.
Dr.Harihara Sreenivasa Rao
Manjunath rSeptember 1, 2019 at 3:02 AM
waw

ಯುನಿಕೋಡ್ : ಏಕೆ? ಹೇಗೆ?

2 comments:

ಹೊಸತು! ಹೊಸತು!!

ಈವರೆಗೆ...

ಗಮನಿಸಿ

ಇಜ್ಞಾನ ಡಾಟ್ ಕಾಮ್