English Bản tin RSS
Trang chủ  |   Liên hệ  |   Hỏi đáp
  • Giới thiệu
    • Giới thiệu chung
    • Sơ đồ cơ cấu tổ chức
    • Chức năng, nhiệm vụ
    • Thông tin lãnh đạo
    • Thông tin giao dịch
    • Danh sách các Hội thành viên và các đơn vị trực thuộc Liên hiệp các hội khoa học và kỹ thuật tỉnh Bình Dương năm 2021
  • Tin tức - sự kiện
    • Liên hiệp hội Bình Dương
    • Tin trong nước
    • Tin trong tỉnh
    • Liên hiệp hội Việt Nam
    • Tin thế giới
    • Bản tin Đất thủ
    • Tin Khoa học - Kỹ thuật
  • Khoa học & Công nghệ
    • Tin khoa học công nghệ
    • Kết quả nghiên cứu
    • Công nghệ mới
    • Tấm gương KHCN
  • Tư vấn - Phản biện
    • Tin hoạt động
    • Kết quả tư vấn, phản biện và giám định xã hội
  • Kinh tế - xã hội
    • Kinh tế
    • Xã hội
    • Thư giản
  • Hội thi sáng tạo kỹ thuật
    • Giải thưởng sáng tạo KHCN
    • Hội thi sáng tạo kỹ thuật
    • Các giải thưởng khác
    • Qũy hổ trợ
  • Cuộc thi sáng tạo
    • Hoạt động hợp tác quốc tế
    • Các dự án
    • Các giải thưởng
    • Quỹ hổ trợ
    • Giải thưởng Sáng tạo KH&CN Việt Nam 2018
  • Cuộc thi Sáng tạo thanh thiếu niên nhi đồng
    • Cuộc thi Sáng tạo thanh thiếu niên nhi đồng
  • Bản tin đất thủ
    • Bản tin số 01 năm 2025
    • Bản tin số 02 năm 2025
  • Văn bản
    • Văn bản pháp quy
    • Văn bản liên hiệp hội
    • Văn bản Tỉnh Ủy Bình Dương
    • Văn bản UBND tỉnh Bình Dương
    • Văn bản khác
    • Nhiệm vụ NCKH-PTCN cấp cơ sở
  • Thành viên LHH
Tiếng nói của Liên hiệp các Hội Khoa học và Kỹ thuật tỉnh Bình Dương - Mái nhà chung của đội ngũ tri thức Bình Dương

Kết quả nghiên cứu

AI: Chuyển từ chữ Nôm sang chữ Quốc ngữ (20/07/2023)

Chữ Nôm là chữ Quốc ngữ đầu tiên do cha ông chúng ta xây dựng dựa trên chất liệu của chữ Hán và đã sử dụng trong gần 1.000 năm từ thế kỷ X đến thế kỷ thứ XIX. Trong suốt mười thế kỷ đó, biết bao công trình về lịch sử, văn học, y học, nông nghiệp, địa lý, … được viết bằng chữ Nôm và còn được lưu lại cho đến ngày hôm nay. Tiếc rằng, phần lớn chưa được dịch (chuyển tự) sang chữ Quốc ngữ (sử dụng con chữ Latin) của ngày hôm nay và đáng tiếc hơn là rất ít người thế hệ hiện nay (nhất là thế hệ trẻ) có khả năng đọc được chữ Nôm để tìm hiểu, khai thác kho tàng văn hóa, tri thức, chứng cứ lịch sử do cha ông để lại. 
 
Việc chuyển tự từ chữ Nôm sang chữ Quốc ngữ hoàn toàn không đơn giản mà ngược lại vô cùng phức tạp do hai hệ chữ không cùng thuộc một loại hình chữ viết. Chữ Nôm thuộc loại hình chữ viết ghi ý (ideographic) còn chữ Quốc ngữ thuộc loại hình chữ viết ghi âm vị theo cách phân chia 6 loại hình chữ viết trên thế giới trong công trình của Rogers H. Chính vì có sự khác biệt hoàn toàn về hệ chữ viết giữa chữ Nôm (hệ ghi ý, dựa theo Hán tự) và chữ Quốc ngữ (hệ ghi âm vị, dựa theo hệ chữ Latin) nên chúng ta không thể áp dụng cách tra bảng (ánh xạ) vì không có sự tương ứng 1-1 giữa một chữ Nôm với một chữ Quốc ngữ như trong ví dụ chữ tiếng Nga hay tiếng Hàn nói trên.
 
Nhóm nghiên cứu gồm 10 giảng viên đến từ Khoa Công nghệ Thông tin, Đại học Khoa học Tự nhiên và Bộ môn Hán - Nôm, khoa Văn học, Đại học Khoa học Xã hội và Nhân văn (Đại học Quốc gia TP HCM). Nhóm xây dựng hệ thống chuyển ngữ tự động (automatic transliteration) từ năm 2020 và hiện đã hoàn thành. Người dùng có thể tra cứu tại: tools.clc.hcmus.edu.vn.
 
Ý tưởng xây dựng hệ thống phiên dịch tự động được PGS.TS Đinh Điền, Giám đốc Trung tâm ngôn ngữ học tính toán, Đại học Khoa học Tự nhiên ấp ủ từ hơn 20 năm trước. Tuy nhiên, thời điểm đó chưa có nhiều nguồn dữ liệu Hán - Nôm cũng như các mô hình máy học tiên tiến. Nhiều năm sau, với sự xuất hiện các mô hình học sâu (deep learning) của trí tuệ nhân tạo, họ mới bắt đầu phát triển mô hình phiên dịch tự động này.
 
Nhóm nghiên cứu thu thập nguồn tài liệu Hán - Nôm tại các viện nghiên cứu, thư viện, website, nhà khoa học trong và ngoài nước với kho dữ liệu hàng trăm triệu từ. Dữ liệu được sử dụng mô hình lai (hybrid) bằng cách kết hợp giữa mô hình máy học dịch thống kê (SMT: Statistical Machine Translation) và mô hình máy dịch theo mạng nơron (NMT: Neural Machine Translation).
 
Theo PGS Điền, mô hình NMT khả năng dịch ngôn ngữ tự nhiên tốt hơn, nhưng với SMT thì khả năng chuyển tự chữ Hán - Nôm sang chữ Quốc ngữ lại có ưu thế hơn do không có sự thay đổi trật tự từ như trong chuyển ngữ thường gặp. Vì vậy, tùy từng trường hợp, nhóm sẽ kết hợp sử dụng mô hình để cho kết quả tối ưu. Với việc xây dựng hệ thống chuyển ngữ hoạt động trên website, khả năng dịch của hệ thống cho độ chính xác tùy theo lĩnh vực.
 
Cụ thể, với các văn bản thuộc lĩnh vực lịch sử, văn học, xã hội, hệ thống cho kết quả chính xác trên 90%. Các văn bản về y học dân tộc và các tài liệu mang tính chuyên ngành, mô hình cho độ chính xác 70%. Riêng truyện Kiều mô hình có thể dịch chính xác tới 99%.
 
Để thuận lợi trong sử dụng, nhóm nghiên cứu đang phát triển mô hình có thể dịch chữ Nôm trên ảnh chụp. Khi người dùng đưa ảnh chụp có chứa chữ Nôm, ứng dụng sẽ xử lý chuyển thành văn bản tiếng Việt.
 
PGS Điền cho biết, với các văn bản cũ chữ bị mờ, thiếu nét, mô hình có thể nhận dạng sai. Tuy nhiên, nhóm đang nghiên cứu giải pháp có khả năng dự đoán chữ viết dựa trên nét chữ và ngữ cảnh trên cả văn bản để có thể đoán chính xác chữ không rõ ràng. Chức năng dịch ảnh đang trong giai đoạn thử nghiệm và chưa ứng dụng công khai. Kết quả thử nghiệm bước đầu một số ảnh chụp văn bản chất lượng thấp, nhưng mô hình có thể nhận dạng chính xác 95%.
 
Theo nhóm nghiên cứu, đây là dự án phi lợi nhuận nhằm hướng đến công cụ dịch chuẩn xác từ chữ Hán - Nôm sang chữ Quốc ngữ. Thông qua dự án, cộng đồng có thể đóng góp nguồn tư liệu chữ Hán - Nôm để cập nhật thêm kho ngữ liệu huấn luyện mô hình phong phú hơn, giúp hoạt động chính xác hơn. Thông qua website, các nhà nghiên cứu có thể hiệu chỉnh những lỗi nhận dạng chữ Hán - Nôm sai hay chuyển tự sai, giúp máy ngày càng hoàn thiện hơn.
 
Có thể nói, đây là nghiên cứu có ý nghĩa to lớn trong việc gìn giữ di sản ngôn ngữ Hán - Nôm. Trước đây việc đọc, hiểu chữ Nôm chủ yếu là trong giới nghiên cứu. Sản phẩm của nhóm có thể giúp người dùng nhận diện, tra cứu thông tin sang chữ Quốc ngữ. Bên cạnh đó, để nghiên cứu được hoàn thiện và chính xác hơn nữa, rất cần sự đóng góp dữ liệu của cộng đồng để mô hình thông minh, dịch chuẩn xác hơn.
 
Quế Trâm



  Tin liên quan
  • Ứng dụng IOT trong nông nghiệp: Xu hướng tất yếu hiện nay (25/11/2023)
  • Trí tuệ nhân tạo AI sẽ tiếp sức cho ngành giao thông vận tải (17/11/2023)
  • Tác động của cuộc Cách mạng công nghiệp 4.0 đến công tác bảo vệ môi trường (22/10/2023)
  • Ứng dụng trí tuệ nhân tạo vào lĩnh vực sản xuất (20/10/2023)
  • Ứng dụng công nghệ nano tăng hiệu quả thuốc Đông y (10/08/2023)
Thông báo
Xem tất cả »

  • Hội nghị tập huấn pháp Luật trong lĩnh vực in năm 2024
  • Quyết định số 29/QĐ-BTCCT về việc ban hành Thể lệ Cuộc thi Sáng tạo dành cho Thanh thiếu niên, nhi đồng tỉnh Bình Dương lần thứ XXI, năm 2024-2025
  • Nghị định số 126/2024/NĐ-CP quy định về tổ chức, hoạt động và quản lý hội
  • Thông báo nhận xét duyệt hồ sơ đăng bạ kỹ sư chuyên nghiệp ASEAN năm 2025
  • Quyết định về việc ban hành Thể lệ "Cuộc thi Robocon tỉnh Bình Dương năm 2024"

Liên kết hữu ích
 

Thống kê truy cập
 
Lượt truy cập: 9838917
Đang online: 35
Các Hội thành viên
  • Hội Tin học tỉnh Bình Dương

  • Hội Laser Y học tỉnh Bình Dương

  • Hội Kiến trúc sư tỉnh Bình Dương

  • Hội Khoa học Lịch sử tỉnh Bình Dương

  • Hội Bảo vệ Quyền lợi người tiêu dùng tỉnh BD

  • Hiệp Hội Dệt may tỉnh Bình Dương

  • Hội Đông Y tỉnh Bình Dương

  • Hội Chăn nuôi - Thú Y tỉnh Bình Dương

  • Hội Y Học tỉnh Bình Dương

  • Hội Dược Học tỉnh Bình Dương

  • Hội Điều Dưỡng tỉnh Bình Dương

  • Hiệp Hội Sơn mài - Điêu khắc tỉnh Bình Dương

  • Hội In Bình Dương

  • Hội Cá cảnh tỉnh Bình Dương

  • Hội Nạn nhân chất độc Da cam-Dioxin tỉnh Bình Dương

  • Hội Sinh Vật cảnh tỉnh Bình Dương

  • Hiệp Hội Du lịch Bình Dương

TRANG THÔNG TIN LIÊN HIỆP CÁC HỘI KHOA HỌC VÀ KỸ THUẬT TỈNH BÌNH DƯƠNG
Địa chỉ: Số 26 Đoàn Thị Liên, Phường Phú Lợi, TP.Thủ Dầu Một, Tỉnh Bình Dương
Điện thoại: 0274.3840554 - Fax: 0274.3840554 - Website: lhhkhktbinhduong.vn

Thiết kế bởi: BINHDUONG CISTI