Vartha Bharati
Vartha Bharati
  • ಸುದ್ದಿಗಳು 
    • ರಾಜ್ಯ
    • ರಾಷ್ಟ್ರೀಯ
    • ಅಂತಾರಾಷ್ಟ್ರೀಯ
    • ಗಲ್ಫ್
    • ಟ್ರೆಂಡಿಂಗ್
    • ಕಾಸರಗೋಡು
    • ಬ್ರೇಕಿಂಗ್
    • ಕ್ರೀಡೆ
    • ಸಿನಿಮಾ
  • ಜಿಲ್ಲೆಗಳು 
    • ದಕ್ಷಿಣಕನ್ನಡ
    • ಉಡುಪಿ
    • ಶಿವಮೊಗ್ಗ
    • ಕೊಡಗು
    • ಯಾದಗಿರಿ
    • ದಾವಣಗೆರೆ
    • ವಿಜಯನಗರ
    • ಚಿತ್ರದುರ್ಗ
    • ಉತ್ತರಕನ್ನಡ
    • ಚಿಕ್ಕಮಗಳೂರು
    • ತುಮಕೂರು
    • ಹಾಸನ
    • ಮೈಸೂರು
    • ಚಾಮರಾಜನಗರ
    • ಬೀದರ್‌
    • ಕಲಬುರಗಿ
    • ರಾಯಚೂರು
    • ವಿಜಯಪುರ
    • ಬಾಗಲಕೋಟೆ
    • ಕೊಪ್ಪಳ
    • ಬಳ್ಳಾರಿ
    • ಗದಗ
    • ಧಾರವಾಡ‌
    • ಬೆಳಗಾವಿ
    • ಹಾವೇರಿ
    • ಮಂಡ್ಯ
    • ರಾಮನಗರ
    • ಬೆಂಗಳೂರು ನಗರ
    • ಕೋಲಾರ
    • ಬೆಂಗಳೂರು ಗ್ರಾಮಾಂತರ
    • ಚಿಕ್ಕ ಬಳ್ಳಾಪುರ
  • ವಿಶೇಷ 
    • ವಾರ್ತಾಭಾರತಿ - ಓದುಗರ ಅಭಿಪ್ರಾಯ
    • ವಾರ್ತಾಭಾರತಿ 22ನೇ ವಾರ್ಷಿಕ ವಿಶೇಷಾಂಕ
    • ಆರೋಗ್ಯ
    • ಇ-ಜಗತ್ತು
    • ತಂತ್ರಜ್ಞಾನ
    • ಜೀವನಶೈಲಿ
    • ಆಹಾರ
    • ಝಲಕ್
    • ಬುಡಬುಡಿಕೆ
    • ಓ ಮೆಣಸೇ
    • ವಾರ್ತಾಭಾರತಿ 21ನೇ ವಾರ್ಷಿಕ ವಿಶೇಷಾಂಕ
    • ಕೃತಿ ಪರಿಚಯ
    • ಮಾಹಿತಿ ಮಾರ್ಗದರ್ಶನ
  • ವಿಚಾರ 
    • ಸಂಪಾದಕೀಯ
    • ಅಂಕಣಗಳು
      • ಬಹುವಚನ
      • ಮನೋ ಚರಿತ್ರ
      • ಮುಂಬೈ ಸ್ವಗತ
      • ವಾರ್ತಾ ಭಾರತಿ ಅವಲೋಕನ
      • ಜನಚರಿತೆ
      • ಈ ಹೊತ್ತಿನ ಹೊತ್ತಿಗೆ
      • ವಿಡಂಬನೆ
      • ಜನ ಜನಿತ
      • ಮನೋ ಭೂಮಿಕೆ
      • ರಂಗ ಪ್ರಸಂಗ
      • ಯುದ್ಧ
      • ಪಿಟ್ಕಾಯಣ
      • ವಚನ ಬೆಳಕು
      • ಆನ್ ರೆಕಾರ್ಡ್
      • ಗಾಳಿ ಬೆಳಕು
      • ಸಂವಿಧಾನಕ್ಕೆ 70
      • ಜವಾರಿ ಮಾತು
      • ಚರ್ಚಾರ್ಹ
      • ಜನಮನ
      • ರಂಗದೊಳಗಿಂದ
      • ಭೀಮ ಚಿಂತನೆ
      • ನೀಲಿ ಬಾವುಟ
      • ರಂಗಾಂತರಂಗ
      • ತಿಳಿ ವಿಜ್ಞಾನ
      • ತಾರಸಿ ನೋಟ
      • ತುಂಬಿ ತಂದ ಗಂಧ
      • ಫೆಲೆಸ್ತೀನ್ ‌ನಲ್ಲಿ ನಡೆಯುತ್ತಿರುವುದೇನು?
      • ಭಿನ್ನ ರುಚಿ
      • ಛೂ ಬಾಣ
      • ಸ್ವರ ಸನ್ನಿಧಿ
      • ಕಾಲಂ 9
      • ಕಾಲಮಾನ
      • ಚಿತ್ರ ವಿಮರ್ಶೆ
      • ದಿಲ್ಲಿ ದರ್ಬಾರ್
      • ಅಂಬೇಡ್ಕರ್ ಚಿಂತನೆ
      • ಕಮೆಂಟರಿ
      • magazine
      • ನನ್ನೂರು ನನ್ನ ಜನ
      • ಕಾಡಂಕಲ್ಲ್ ಮನೆ
      • ಅನುಗಾಲ
      • ನೇಸರ ನೋಡು
      • ಮರು ಮಾತು
      • ಮಾತು ಮೌನದ ಮುಂದೆ
      • ಒರೆಗಲ್ಲು
      • ಮುಂಬೈ ಮಾತು
      • ಪ್ರಚಲಿತ
    • ಲೇಖನಗಳು
    • ವಿಶೇಷ-ವರದಿಗಳು
    • ನಿಮ್ಮ ಅಂಕಣ
  • ಟ್ರೆಂಡಿಂಗ್
  • ಕ್ರೀಡೆ
  • ವೀಡಿಯೋ
  • ಸೋಷಿಯಲ್ ಮೀಡಿಯಾ
  • ಇ-ಪೇಪರ್
  • ENGLISH
images
  • ಸುದ್ದಿಗಳು
    • ರಾಜ್ಯ
    • ರಾಷ್ಟ್ರೀಯ
    • ಅಂತಾರಾಷ್ಟ್ರೀಯ
    • ಗಲ್ಫ್
    • ಟ್ರೆಂಡಿಂಗ್
    • ಕಾಸರಗೋಡು
    • ಬ್ರೇಕಿಂಗ್
    • ಕ್ರೀಡೆ
    • ಸಿನಿಮಾ
  • ಜಿಲ್ಲೆಗಳು
    • ದಕ್ಷಿಣಕನ್ನಡ
    • ಉಡುಪಿ
    • ಮೈಸೂರು
    • ಶಿವಮೊಗ್ಗ
    • ಕೊಡಗು
    • ದಾವಣಗೆರೆ
    • ವಿಜಯನಗರ
    • ಚಿತ್ರದುರ್ಗ
    • ಉತ್ತರಕನ್ನಡ
    • ಚಿಕ್ಕಮಗಳೂರು
    • ತುಮಕೂರು
    • ಹಾಸನ
    • ಚಾಮರಾಜನಗರ
    • ಬೀದರ್‌
    • ಕಲಬುರಗಿ
    • ಯಾದಗಿರಿ
    • ರಾಯಚೂರು
    • ವಿಜಯಪುರ
    • ಬಾಗಲಕೋಟೆ
    • ಕೊಪ್ಪಳ
    • ಬಳ್ಳಾರಿ
    • ಗದಗ
    • ಧಾರವಾಡ
    • ಬೆಳಗಾವಿ
    • ಹಾವೇರಿ
    • ಮಂಡ್ಯ
    • ರಾಮನಗರ
    • ಬೆಂಗಳೂರು ನಗರ
    • ಕೋಲಾರ
    • ಬೆಂಗಳೂರು ಗ್ರಾಮಾಂತರ
    • ಚಿಕ್ಕ ಬಳ್ಳಾಪುರ
  • ವಿಶೇಷ
    • ವಾರ್ತಾಭಾರತಿ 22ನೇ ವಾರ್ಷಿಕ ವಿಶೇಷಾಂಕ
    • ಆರೋಗ್ಯ
    • ತಂತ್ರಜ್ಞಾನ
    • ಜೀವನಶೈಲಿ
    • ಆಹಾರ
    • ಝಲಕ್
    • ಬುಡಬುಡಿಕೆ
    • ಓ ಮೆಣಸೇ
    • ವಾರ್ತಾಭಾರತಿ 21ನೇ ವಾರ್ಷಿಕ ವಿಶೇಷಾಂಕ
    • ಕೃತಿ ಪರಿಚಯ
    • ಮಾಹಿತಿ ಮಾರ್ಗದರ್ಶನ
  • ವಿಚಾರ
    • ಸಂಪಾದಕೀಯ
    • ಅಂಕಣಗಳು
    • ಲೇಖನಗಳು
    • ವಿಶೇಷ-ವರದಿಗಳು
    • ನಿಮ್ಮ ಅಂಕಣ
  • ಟ್ರೆಂಡಿಂಗ್
  • ಕ್ರೀಡೆ
  • ವೀಡಿಯೋ
  • ಸೋಷಿಯಲ್ ಮೀಡಿಯಾ
  • ಇ-ಪೇಪರ್
  • ENGLISH
  1. Home
  2. ಸುಗ್ಗಿ
  3. ಕಂಪ್ಯೂಟರ್ ವಿಜ್ಞಾನದ ಹೊಸ ಶಾಖೆ: ಗಣನಾ...

ಕಂಪ್ಯೂಟರ್ ವಿಜ್ಞಾನದ ಹೊಸ ಶಾಖೆ: ಗಣನಾ ಭಾಷಾಶಾಸ್ತ್ರ

ಡಿಜಿಟಲ್ ಕನ್ನಡ

ಡಾ. ಎ. ಸತ್ಯನಾರಾಯಣಡಾ. ಎ. ಸತ್ಯನಾರಾಯಣ31 Dec 2017 12:08 AM IST
share
ಕಂಪ್ಯೂಟರ್ ವಿಜ್ಞಾನದ ಹೊಸ ಶಾಖೆ: ಗಣನಾ ಭಾಷಾಶಾಸ್ತ್ರ

ಕಂಪ್ಯೂಟರಿನಲ್ಲಿ ಭಾಷಾ ಲಿಪಿ ಬಳಕೆಯ ವ್ಯವಸ್ಥೆಯನ್ನು ರೂಪಿಸಲು ಬಳಸಲಾಗುವ ತಂತ್ರಜ್ಞಾನದ ಒಂದು ವಿಭಾಗವನ್ನು ‘ಭಾಷಾ ಲಿಪಿತಂತ್ರಜ್ಞಾನ’ ಎಂದು ಮೊದಲಿಗೆ ಕರೆಯಲಾಯಿತು. ಇಂದು ‘ಭಾಷಾ ಲಿಪಿತಂತ್ರಜ್ಞಾನ’ದ ಪರಿಕಲ್ಪನೆ ಮತ್ತು ವ್ಯಾಪ್ತಿಯು ಲಿಪಿವ್ಯವಸ್ಥೆಯನ್ನೂ ಮೀರಿ ವಿಸ್ತರಿಸಿದೆ.

ನಾವು ಮಾತನಾಡುವ ಮತ್ತು ಬರೆಯುವ ಭಾಷೆಯ ಧ್ವನಿ ಮತ್ತು ಬರಹರೂಪಗಳನ್ನು ಸೃಷ್ಟಿಸುವುದು, ಗುರುತಿಸುವುದು, ದಾಖಲಿಸುವುದು ಮತ್ತು ವಿಶ್ಲೇಷಿಸುವುದು ಇತ್ಯಾದಿಗಳನ್ನು ಮಾಡುವ ಕಂಪ್ಯೂಟರ್ ವ್ಯವಸ್ಥೆಗಳ ಸಂಶೋಧನೆಯನ್ನು ‘ಭಾಷಾ ತಂತ್ರಜ್ಞಾನ ಎನ್ನಲಾಗಿದೆ. ಧ್ವನಿಸಂಸ್ಕರಣೆ (ಧ್ವನಿ ಗುರುತಿಸುವುದು ಮತ್ತು ಅರ್ಥೈಸುವುದು ಹಾಗೂ ವಿಶ್ಲೇಷಿಸುವುದು), ಮಾಹಿತಿಯನ್ನು ಹೆಕ್ಕಿ ತೆಗೆಯುವುದು, ಕೈಬರಹ ಗುರುತಿಸುವುದು, ಯಂತ್ರ ಭಾಷಾಂತರ, ಪಠ್ಯ ಸಾರಾಂಶಗೊಳಿಸುವುದು ಮತ್ತು ಭಾಷಾ ಲಿಪಿಗಳನ್ನು ಮತ್ತು ಉಚ್ಚಾರಣೆಗಳನ್ನು ಸೃಷ್ಟಿಸುವುದು. - ಇವುಗಳು ಭಾಷಾ ತಂತ್ರಜ್ಞಾನದ ಪ್ರಮುಖವಾದ ಸಂಶೋಧನೆಗಳು. ಕಂಪ್ಯೂಟರ್ ವಿಜ್ಞಾನ ಮತ್ತು ಭಾಷಾಶಾಸ್ತ್ರ ಇವೆರಡರ ಸಮ್ಮಿಲನದಿಂದಾಗಿ ಇಂದು ‘ಗಣನಾ ಭಾಷಾಶಾಸ್ತ್ರ (ಕಂಪ್ಯೂಟೇಶನಲ್ ಲಿಂಗ್ವಿಸ್ಟಿಕ್ಸ್) ಎಂಬ ಹೊಸ ಜ್ಞಾನಶಿಸ್ತು ಆರಂಭಗೊಂಡಿದೆ. ಕಂಪ್ಯೂಟರ್‌ಗಳ ಮೂಲಕ ಕೈಗೊಳ್ಳುವ, ಮಾನವ ಸಹಜ ಭಾಷೆಗಳ ಸರ್ವಸಾಮರ್ಥ್ಯದ ವಿವಿಧ ಆಯಾಮಗಳ ಗಣನಾಕಾರ್ಯವನ್ನು (ಕಂಪ್ಯೂಟಿಂಗ್) ‘ಕಂಪ್ಯೂಟೇಶನಲ್ ಲಿಂಗ್ವಿಸ್ಟಿಕ್ಸ್’ ಎಂದು ಕರೆಯಾಗಿದೆ. ಮಾನವನ ಗ್ರಹಣಶಕ್ತಿ, ನೆನಪಿನಶಕ್ತಿ ಮತ್ತು ವಿವೇಚನಾಶಕ್ತಿಗಳ ರೀತಿಯಲ್ಲಿಯೇ, ಗಣನಕ್ರಿಯೆಗಳ ಮೂಲಕ, ಯಾಂತ್ರಿಕ ಮಾದರಿಗಳನ್ನು ತಯಾರಿಸುವ ಉದ್ದೇಶದ ಆರಂಭಗೊಂಡ ‘ಕಂಪ್ಯೂಟೇಶನಲ್ ಲಿಂಗ್ವಿಸ್ಟಿಕ್ಸ್’ ಕಂಪ್ಯೂಟರ್ ವಿಜ್ಞಾನದ ಒಂದು ಹೊಸ ಶಾಖೆಯಾಗಿ ಅಭಿವೃದ್ಧಿಗೊಳ್ಳುತ್ತಿದೆ. ಗಣನಾಭಾಷಾಶಾಸ್ತ್ರದ ಉತ್ಪನ್ನಗಳಾದ ಆನ್ವಯಿಕ ತಂತ್ರಾಂಶಗಳು (ಅಪ್ಲಿಕೇಷನ್ ಸಾಫ್ಟ್ ವೇರ್), ಕಿರುತಂತ್ರಾಂಶಗಳು (ಆ್ಯಪ್‌ಗಳು) ಇಂಗ್ಲಿಷ್‌ಗೆ ಮಾತ್ರವೇ ಸೀಮಿತವಾಗಿ ಉಳಿದಿಲ್ಲ. ಇಂದು, ಕನ್ನಡವೂ ಸೇರಿದಂತೆ ಇಂಗ್ಲಿಷೇತರ ಭಾಷೆಗಳಲ್ಲಿ ಅವುಗಳು ಸ್ಮಾರ್ಟ್‌ಫೋನ್ ಮತ್ತು ಕಂಪ್ಯೂಟರ್‌ಗಳಲ್ಲಿ ಬಳಕೆಗೆ ಬಂದು ಜನಪ್ರಿಯಗೊಂಡಿವೆ.

ಮಾತನಾಡುವ ಭಾಷೆಗಳನ್ನು ಕಂಪ್ಯೂಟರ್ ಮತ್ತು ಸ್ಮಾರ್ಟ್ ಫೋನ್‌ಗಳು ಗುರುತಿಸಲು ‘ಭಾಷಾ ವ್ಯವಸ್ಥೆ’ಗಳನ್ನು ರೂಪಿಸುವಲ್ಲಿ ಹಲವು ಹಂತಗಳಿವೆ. ಭಾಷೆಯನ್ನು ಬಳಸುವ ಮತ್ತು ಅದನ್ನು ಅರ್ಥಮಾಡಿಕೊಳ್ಳುವಲ್ಲಿನ ಉಪಾಯಗಳನ್ನು ಆಲೋಚಿಸುವುದು ಮೊದಲ ಹೆಜ್ಜೆಯಾದರೆ, ಅಂತಹ ಆಲೋಚನೆಗಳನ್ನು ಪ್ರೋಗ್ರಾಮ್‌ಗಳ ಮೂಲಕ ಯಾಂತ್ರೀಕೃತ ಮಾದರಿಗಳನ್ನಾಗಿ ಪರಿವರ್ತಿಸುವುದು ಎರಡನೆಯ ಹೆಜ್ಜೆಯಾಗಿದೆ. ಇಂತಹ ಯಾಂತ್ರೀಕೃತ ಮಾದರಿಗಳೇ ಹಲವು ಪ್ರಯೋಗಗಳ ಮೂಲಕ ಗಟ್ಟಿಗೊಂಡು ‘ತಂತ್ರಜ್ಞಾನ’ಗಳಾಗಿ ಬಳಕೆಗೆ ಬಂದಿವೆ. ಭಾಷಾಲಿಪಿಗಳು ಕಂಪ್ಯೂಟರಿನಲ್ಲಿ ಅನುಸ್ಥಾಪನೆಗೊಂಡ ನಂತರದಲ್ಲಿ, ಭಾಷೆಯ ಪಠ್ಯವನ್ನು ವಾಕ್ಯಗಳ ರೂಪದಲ್ಲಿ ಊಡಿಸುವುದು; ಊಡಿಸಿದ ವಾಕ್ಯಗಳಲ್ಲಿನ ಪದಗಳ ಕಾಗುಣಿತವನ್ನು ಯಂತ್ರಾಧಾರಿತವಾಗಿ ಪರೀಕ್ಷಿಸುವುದು; ವಾಕ್ಯಗಳ ರಚನೆಯಲ್ಲಿ ಅಗತ್ಯವಿರುವ ಪದಗಳನ್ನು ಯಂತ್ರದಲ್ಲಿಯೇ ಅಳವಡಿಸಲಾಗಿರುವ ಅರ್ಥಕೋಶಗಳಿಂದ ಹೆಕ್ಕಿತೆಗೆದುಕೊಳ್ಳುವುದು; ಬಳಸಿದ ಪದಗಳ ಬದಲಾಗಿ ಅಗತ್ಯವಿದ್ದರೆ, ಸಮಾನಾರ್ಥಕ ಅರ್ಥಕೋಶ ಬಳಸಿ ಹೊಸ ಸಮಾನಾರ್ಥಕ ಪದಗಳನ್ನು ತಕ್ಷಣದಲ್ಲಿ ಆಯ್ಕೆಮಾಡಿಕೊಳ್ಳುವುದು; ಪದಗಳನ್ನು ಅಕ್ಷರಾನುಕ್ರಮಣಿಕೆಯಲ್ಲಿ ವಿಂಗಡಿಸುವುದು ಮತ್ತು ಸೂಚೀಕರಿಸುವುದು - ಇವೆಲ್ಲವುಗಳನ್ನು ‘ಪದಸಂಸ್ಕರಣೆ (ವರ್ಡ್ ಪ್ರೊಸೆಸಿಂಗ್) ಎಂದು ಕರೆಯಲಾಗುವ ‘ಭಾಷಾ ಲಿಪಿಸಂಸ್ಕರಣೆ’ಯ ಕಾರ್ಯವಾಗಿದೆ.

ಭಾಷಾ ಸಂಸ್ಕರಣೆಯನ್ನು ನಿರ್ವಹಿಸಲು ಕಂಪ್ಯೂಟರ್‌ಗಳಲ್ಲಿ ಕೇವಲ ಭಾಷೆಯ ಲಿಪಿವ್ಯವಸ್ಥೆಗಳಷ್ಟೇ ಸಾಕಾಗುವುದಿಲ್ಲ. ಇದಕ್ಕೆ ಡಿಜಿಟಲ್ ರೂಪದ ಅರ್ಥಕೋಶಗಳು (ಡಿಕ್ಷ್‌ನರಿ) ಮತ್ತು ಅಂತಹ ಅರ್ಥಕೋಶಗಳ ಪರಾಮರ್ಶನ ವ್ಯವಸ್ಥೆಗಳನ್ನು ತಂತ್ರಾಂಶದಲ್ಲಿ ನಿರ್ಮಿಸಲು ಪ್ರತ್ಯೇಕ ತಂತ್ರಜ್ಞಾನಗಳ ಅಗತ್ಯವಿದೆ. ಈ ಎಲ್ಲ ರೀತಿಯ ವ್ಯವಸ್ಥೆಗಳನ್ನು ಬಳಕೆದಾರನಿಗೆ ನಿರ್ಮಿಸಿಕೊಡಲು ತಂತ್ರಾಂಶ ತಯಾರಕರಿಗೆ ಭಾಷಾ ತಂತ್ರಜ್ಞಾನವು ವರದಾನವಾಗಿದೆ. ಪಠ್ಯದಲ್ಲಿನ ಪದಗಳ ಕಾಗುಣಿತ ಪರೀಕ್ಷೆ, ವಾಕ್ಯಗಳ ವ್ಯಾಕರಣ ಪರೀಕ್ಷೆ ಹಾಗೂ ಒಂದು ಭಾಷೆಯ ಲಿಪಿಯಿಂದ ಮತ್ತೊಂದು ಭಾಷೆಯ ಲಿಪಿಗೆ ಲಿಪ್ಯಂತರಿಸುವುದು; ಒಂದು ಭಾಷೆಯಿಂದ ಮತ್ತೊಂದು ಭಾಷೆಗೆ ಭಾಷಾಂತರಿಸುವುದು; ಲಿಪಿರೂಪದ ಪಠ್ಯವನ್ನು ಉಚ್ಚಾರಣೆಯ ಧ್ವನಿರೂಪಕ್ಕೆ ಪರಿವರ್ತಿಸುವುದು; ಮಾತಿನ ಧ್ವನಿರೂಪವನ್ನು ಲಿಪಿರೂಪದ ಪಠ್ಯಕ್ಕೆ ಪರಿವರ್ತಿಸುವುದು - ಇವೆಲ್ಲವನ್ನು ‘ಲಾಂಗ್ವೇಜ್ ಕಂಪ್ಯೂಟಿಂಗ್’ ಅಂದರೆ, ‘ಭಾಷಾ ಸಂಗಣನೆ’ ಎನ್ನಲಾಗಿದೆ. ಭಾಷೆಗಳ ಲಿಪಿಗಳನ್ನು ಕಂಪ್ಯೂಟರ್‌ಗಳಲ್ಲಿ ಅಳವಡಿಸುವ ತಂತ್ರಜ್ಞಾನಕ್ಕೆ ‘ಲಿಪಿತಂತ್ರಜ್ಞಾನ’ ಎನ್ನಲಾಗಿದೆ. ಹಾಗೆಯೇ, ಭಾಷಾ ಪಠ್ಯದ ವಾಕ್ಯ ವಿಶ್ಲೇಷಣೆ, ಪದಗಳ ಕನ್‌ಕಾರ್ಡೆನ್ಸ್, ಉನ್ನತ ರೀತಿಯಲ್ಲಿ ವ್ಯಾಕರಣ ಪರೀಕ್ಷೆ ಮತ್ತು ಭಾಷಾಂತರ ಇತ್ಯಾದಿಗಳನ್ನು ನಿರ್ವಹಿಸುವುದಕ್ಕೆ ‘ನ್ಯಾಚುರಲ್ ಲಾಂಗ್ವೇಜ್ ಪ್ರೋಸೆಸಿಂಗ್’ (ಎನ್.ಎಲ್.ಪಿ.) ಅಂದರೆ, ‘ಸಹಜ ಭಾಷಾ ಸಂಸ್ಕರಣೆ’ ಎನ್ನಲಾಗಿದೆ. ಲಿಪಿತಂತ್ರಜ್ಞಾನ ಮತ್ತು ಸಹಜ ಭಾಷಾ ಸಂಸ್ಕರಣೆಗೆ ಬಳಕೆಯಾಗುವ ಎಲ್ಲಾ ಕಂಪ್ಯೂಟರ್ ತಂತ್ರಜ್ಞಾನಗಳನ್ನು ಒಟ್ಟಾಗಿ ‘ಭಾಷಾ ತಂತ್ರಜ್ಞಾನ’ ಎಂದು ಕರೆಯಲಾಗಿದೆ. ಲಿಪಿತಂತ್ರಜ್ಞಾನವು ಭಾಷಾ ತಂತ್ರಜ್ಞಾನದ ಅಡಿಯಲ್ಲಿ ಒಂದು ಪ್ರಮುಖ ಶಾಖೆಯಾಗಿದೆ. ಲಿಪಿಯು ಭಾಷೆಯ ಚಾಕ್ಷುಕ ರೂಪ ಮತ್ತು ಒಂದು ಪ್ರಮುಖ ಅಂಗ. ಲಿಪಿರೂಪದ ಮಾಹಿತಿಯನ್ನು ‘ಪಠ್ಯ’ ಎಂದು ಕರೆಯಲಾಗಿದೆ. ಪಠ್ಯವು ಭಾಷಾ ತಂತ್ರಜ್ಞಾನದ ಮೂಲಾಧಾರ. ಡಿಜಿಟಲ್ ತಂತ್ರಜ್ಞಾನದಲ್ಲಿ ಮಾಹಿತಿಗಳನ್ನು ‘ವಿದ್ಯುನ್ಮಾನ ಪಠ್ಯ’ ಎಂದು ಕರೆಯಲಾಗುತ್ತದೆ. ಅಕ್ಷರಗಳಿಂದಾದ ಪದಗಳು, ಪದಗಳಿಂದಾದ ವಾಕ್ಯಗಳು ಮತ್ತು ವಾಕ್ಯಗಳಿಂದಾದ ಭಾಷಾ ಪಠ್ಯವು ವಿದ್ಯುನ್ಮಾನ ಪಠ್ಯವಾಗಿ ರೂಪುಗೊಂಡಾಗ ಮಾತ್ರ ಅದರ, ಗುರುತಿಸುವಿಕೆ, ಸಂಗ್ರಹಣೆ, ಸಂಸ್ಕರಣೆ ಮತ್ತು ವಿಶ್ಲೇಷಣೆ, ಭಾಷಾಂತರ, ಲಿಪ್ಯಂತರ, ಪಠ್ಯದಿಂದ ಧ್ವನಿಗೆ ಪರಿವರ್ತನೆ; ಧ್ವನಿಯಿಂದ ಪಠ್ಯಕ್ಕೆ ಪರಿವರ್ತನೆ - ಇವೆಲ್ಲವುಗಳನ್ನು ನಿರ್ವಹಿಸುವ ‘ಭಾಷಾ ತಂತ್ರಜ್ಞಾನ’ಕ್ಕೆ ಪ್ರಾಮುಖ್ಯತೆ ದೊರೆಯುತ್ತದೆ.

 ಕಂಪ್ಯೂಟರಿನಲ್ಲಿ ಭಾಷಾ ಲಿಪಿ ಬಳಕೆಯ ವ್ಯವಸ್ಥೆಯನ್ನು ರೂಪಿಸಲು ಬಳಸಲಾಗುವ ತಂತ್ರಜ್ಞಾನದ ಒಂದು ವಿಭಾಗವನ್ನು ‘ಭಾಷಾ ಲಿಪಿತಂತ್ರಜ್ಞಾನ’ ಎಂದು ಮೊದಲಿಗೆ ಕರೆಯಲಾಯಿತು. ಇಂದು ‘ಭಾಷಾ ಲಿಪಿತಂತ್ರಜ್ಞಾನ’ದ ಪರಿಕಲ್ಪನೆ ಮತ್ತು ವ್ಯಾಪ್ತಿಯು ಲಿಪಿವ್ಯವಸ್ಥೆಯನ್ನೂ ಮೀರಿ ವಿಸ್ತರಿಸಿದೆ. ಸಹಜ ಭಾಷೆಯ ಲಿಪಿಗಳನ್ನು ಕಂಪ್ಯೂಟರ್‌ನಲ್ಲಿ ಅಳವಡಿಸುವುದು; ಅವುಗಳ ಸಮರ್ಥ ಬಳಕೆಗೆ ಅಗತ್ಯವಿರುವ ಸೌಲಭ್ಯಗಳನ್ನು ಕಲ್ಪಿಸುವುದು; ಪಠ್ಯರೂಪದ ಮಾಹಿತಿಗಳನ್ನು ಸಿದ್ಧಪಡಿಸುವುದು, ಪದ, ಕಾಗುಣಿತ ಮತ್ತು ವ್ಯಾಕರಣ ಪರೀಕ್ಷೆ - ಇವುಗಳಿಗಷ್ಟೇ ಲಿಪಿತಂತ್ರಜ್ಞಾನವು ಇಂದು ಸೀಮಿತವಾಗಿಲ್ಲ. ಬದಲಾಗಿ, ಭಾಷಾ ವಾಕ್ಯಗಳ ವಿಶ್ಲೇಷಣೆ, ಪರಸ್ಪರ ಭಾಷೆಗಳಿಗೆ ಲಿಪ್ಯಂತರ (ಟ್ರಾನ್ಸ್ ಲಿಟರೇಷನ್) ಮತ್ತು ಯಂತ್ರಾಧಾರಿತ ಭಾಷಾಂತರ (ಟ್ರಾನ್ಸ್ ಲೇಷನ್) ವ್ಯವಸ್ಥೆಗಳನ್ನು ರೂಪಿಸುವಲ್ಲಿ ಪ್ರಧಾನ ಪಾತ್ರವನ್ನು ವಹಿಸುವ ಮೂಲಕ ತನ್ನ ವ್ಯಾಪ್ತಿಯನ್ನು ಹೆಚ್ಚಿಸಿಕೊಳ್ಳುತ್ತಿದೆ. ಇದರಿಂದ ಭಾಷಾ ತಂತ್ರಜ್ಞಾನದ ಉಪಯುಕ್ತ ಕೊಡುಗೆಯಾದ ’ಸಹಜ ಭಾಷಾ ಸಂಸ್ಕರಣೆ’(Natural Language Processing-NLP) ಎಂಬುದು ಇಂದು ಇಂಗ್ಲಿಷೇತರ ಭಾಷೆಗಳಲ್ಲಿಯೂ ಆರಂಭಗೊಂಡಿದೆ. ಭಾಷಾ ಸಂಶೋಧಕರು ವಿವಿಧ ಸಂಶೋಧನಾ ಉದ್ದೇಶಗಳಿಗಾಗಿ ಮತ್ತು ಕೃತಿಗಳ ತೌಲನಿಕ ಆಧ್ಯಯನಕ್ಕಾಗಿ ’ಕೃತಿಗಳ ಕನ್‌ಕಾರ್ಡೆನ್ಸ್ ಇಂಡೆಕ್ಸ್’, ಅಂದರೆ, ’ಪದಪ್ರಯೋಗ ಕೋಶ’ವನ್ನು ಸಿದ್ಧಪಡಿಸಿಕೊಳ್ಳಬೇಕಾಗುತ್ತದೆ. ಕಷ್ಟಕರವಾದ ಇಂತಹ ಕೆಲಸವನ್ನು ಕಂಪ್ಯೂಟರ್ ಬಳಸಿ ನಿರ್ವಹಿಸಲು ಅಗತ್ಯವಿರುವ ‘ಸಾರ್ಟಿಂಗ್ ಮತ್ತು ಇಂಡೆಕ್ಸಿಂಗ್ (ವರ್ಗೀಕರಣ ಮತ್ತು ಸೂಚೀಕರಣ) ಸವಲತ್ತುಗಳನ್ನು ಇಂದು ಲಿಪಿತಂತ್ರಾಂಶಗಳು ಒದಗಿಸುತ್ತಿವೆ. ಇಂಗ್ಲಿಷ್ ಅಷ್ಟೇ ಅಲ್ಲದೆ, ಇಂಗ್ಲಿಷೇತರ ಭಾಷಾ ಅನಕ್ಷರಸ್ಥರಿಗೆ ಹಾಗೂ ಅಂಧರಿಗೆ ವಿದ್ಯುನ್ಮಾನ ಪಠ್ಯವನ್ನು ಓದಿ ಹೇಳುವ ತಂತ್ರಜ್ಞಾನವು ಇಂದು ಅತ್ಯಗತ್ಯವಾಗಿದೆ. ಪರದೆಯಲ್ಲಿರುವ ಕನ್ನಡ ಪಠ್ಯವನ್ನು ಧ್ವನಿಗೆ ಪರಿವರ್ತಿಸಿ ಓದಿಹೇಳುವ ‘ಇ-ಸ್ಪೀಕ್ ತಂತ್ರಾಂಶವು ಕನ್ನಡಕ್ಕೆ ಲಭ್ಯವಿದೆ. ಇದೇ ಉದ್ದೇಶದ ‘ಮಧುರವಾಚಕ ಎಂಬ ಹೆಸರಿನ ಸುಧಾರಿತ ತಂತ್ರಾಂಶವು ಆನ್‌ಲೈನ್‌ನಲ್ಲಿ ಲಭ್ಯವಿದೆ. ವಿದ್ಯುನ್ಮಾನ ಪಠ್ಯವನ್ನು ಧ್ವನಿರೂಪಕ್ಕೆ ಪರಿವರ್ತಿಸುವ ‘ಟೆಕ್ಸ್ಟ್-ಟು-ಸ್ಪೀಚ್’ ಮತ್ತು ಧ್ವನಿರೂಪದ ಮಾತುಗಳನ್ನು ಕಂಪ್ಯೂಟರ್ ಪಠ್ಯವನ್ನಾಗಿ ಪರಿವರ್ತಿಸಿ ನೀಡುವ ‘ಸ್ಪೀಚ್-ಟು-ಟೆಕ್ಸ್ಟ್’ ತಂತ್ರಾಂಶಗಳು ಭಾಷಾ ತಂತ್ರಜ್ಞಾನದ ಕೊಡುಗೆಗಳಾಗಿವೆ.

ಡಾ. ಎ. ಸತ್ಯನಾರಾಯಣ   

share
ಡಾ. ಎ. ಸತ್ಯನಾರಾಯಣ
ಡಾ. ಎ. ಸತ್ಯನಾರಾಯಣ
Next Story
X