Viettel Cyberspace công bố nghiên cứu khoa học ở hội nghị AI hàng đầu thế giới
TheôngbốnghiêncứukhoahọcởhộinghịAIhàngđầuthếgiớlịch âm lịch hôm nayo đại diện Viettel Cyberspace (thành viên thuộc Tập đoàn Công nghiệp - Viễn thông Quân đội), trích xuất thông tin trong bảng biểu thuộc ảnh tài liệu đang là bài toán thách thức do cấu trúc đọc khác biệt với dữ liệu đoạn văn thông thường, trong khi thông tin của bảng lại mang nhiều ý nghĩa quan trọng, nhất là trong các lĩnh vực tài chính, ngân hàng, bảo hiểm.
Từ đó, nghiên cứu của Viettel Cyberspace tập trung cải thiện hiệu suất nhận diện cấu trúc bảng trong ảnh tài liệu, đặc biệt là với những bảng có cấu trúc phức tạp. Công nghệ này hiện đang được ứng dụng trong Viettel Intelligent Document Processing (Viettel IDP), thuộc hệ sinh thái sản phẩm Viettel AI, cho phép chuyển đổi không chỉ chữ mà cả bảng biểu từ dạng hình ảnh sang định dạng có thể chỉnh sửa được như Excel, Word với độ chính xác cao.

Điểm khác biệt của Viettel IDP là xem bảng biểu là một thực thể quan trọng trong ảnh tài liệu để trích xuất toàn bộ thông tin, thay vì chỉ coi là một đối tượng ảnh thông thường. Công nghệ này được coi là một trong những thành phần cốt lõi trong xây dựng công cụ chuyển đổi số và tìm kiếm thông tin thông minh.
Ông Nguyễn Mạnh Quý, Giám đốc Viettel Cyberspace chia sẻ: “Viettel Cyberspace luôn đề cao nghiên cứu công nghệ gắn liền với ứng dụng thực tiễn. Với các công nghệ lõi trong lĩnh vực trí tuệ nhân tạo (AI), chúng tôi xác định mục tiêu không ngừng nghiên cứu, tìm tòi và phát triển các phương pháp, thuật toán mới. Từ đó, liên tục ứng dụng nâng cấp chất lượng của các sản phẩm, dịch vụ trong hệ sinh thái Viettel AI, hỗ trợ hiệu quả cho quá trình chuyển đổi số của các tổ chức, doanh nghiệp và chính phủ”.

Kết quả nghiên cứu đã được Viettel Cyberspace công bố tại hội nghị về phân tích và nhận dạng tài liệu - International Conference on Document Analysis and Recognition (ICDAR) lần thứ 17, tổ chức tại California, Hoa Kỳ. Hội nghị có sự tham dự của nhiều chuyên gia cấp cao đến từ các tổ chức hàng đầu về nghiên cứu AI trong lĩnh vực xử lý ảnh tài liệu như Google Research, Microsoft Research, Adobe, Naver, CASIA, Wacom, Goodnote… Viettel là đơn vị duy nhất của Việt Nam với đội ngũ nghiên cứu hoàn toàn trong nước có thành viên tham dự và trình bày nghiên cứu tại hội nghị này.
ICDAR thuộc top 14,55% hội nghị uy tín nhất thế giới về AI trong số các hội nghị được xếp hạng. Đây là sự kiện quốc tế hàng đầu dành cho các nhà khoa học, kỹ sư về phân tích và nhận dạng tài liệu, một lĩnh vực ngày càng quan trọng trong thời đại chuyển đổi số hiện nay. Các nghiên cứu khoa học sẽ phải vượt qua nhiều vòng thẩm định vô danh khắt khe từ hội đồng chuyên gia đến từ nhiều quốc gia trên thế giới. Hội nghị được tổ chức 2 năm một lần, trung bình có khoảng 30% nghiên cứu được chấp nhận mỗi năm.
Thông thường, việc nhận diện các ô gộp trong bảng (spanning cells) dễ bị bỏ sót nội dung, sai định dạng khiến thông tin không còn chính xác. Thay vì chỉ lấy thông tin từ một số ô lân cận ô gộp để xử lý như các phương pháp cũ, Viettel Cyberspace đề xuất sử dụng mạng nơ-ron dựa trên cấu trúc Transformer, nhận diện đặc trưng từ tất cả các ô trong bảng, giúp nhận diện đúng và không bỏ sót nội dung. Phương pháp này đặc biệt hiệu quả với các ô trong bảng, không chỉ áp dụng với ô tiêu đề. Thử nghiệm trên các bộ dữ liệu chuẩn, phương pháp này cho kết quả cao hơn hẳn về độ chính xác so với các phương pháp đã được công bố trước đó. Cụ thể, cao hơn 0,3% F1-score trên tập dữ liệu SciTSR-COMP và cao hơn 1,2% WAvgF1 trên tập ICDAR19-cTDaR so với kết quả đứng thứ hai. Viettel Cyberspace hiện cung cấp hệ sinh thái sản phẩm trí tuệ nhân tạo Viettel AI gồm 5 dòng sản phẩm: Nền tảng Trí tuệ nhân tạo, Nền tảng Quản trị và Phân tích dữ liệu, Nền tảng Trợ lý ảo, Nền tảng Robot thông minh và Nền tảng Bản sao số. |
Quốc Tuấn
(责任编辑:Thể thao)
- Kèo vàng bóng đá Bosnia vs Cyprus, 02h45 ngày 25/3: Khách gây thất vọng
- Dòng sông ly biệt: Nỗi đau của đứa con vợ lẽ
- Nhật Bản triển khai gián điệp AI để ngăn chặn tội phạm
- Chuyển đổi số để nâng cao chất lượng khám, chữa bệnh
- Nhận định, soi kèo Sarajevo vs Borac, 03h00 ngày 27/3: Tin vào cửa dưới
- Nghi mất tiền trong ngân hàng do TeamViewer bị hack
- Apple tăng cường bảo mật cho iPhone sau khi bị FBI mở khoá
- Con gái Chi cục trưởng sáng giả nghèo, tối lên bar trong Đấu trí là ai?
- Nhận định, soi kèo Fukushima United vs Consadole Sapporo, 17h00 ngày 26/3: Tiếp tục thăng hoa
- Bình Định đẩy mạnh cải cách hành chính, chuyển đổi số, tăng thu hút đầu tư
- Phát triển các không gian sách, đa dạng hình thức đọc ở TP.HCM
- Á hậu Việt Nam 2016 tiết lộ các nguyên tắc trang phục khi dẫn sóng VTV
- Nhận định, soi kèo Deportivo Cali vs America de Cali, 06h10 ngày 25/3: Cửa trên gặp khó
- Mỹ nhân Gal Gadot chia sẻ độc quyền với VietNamNet về phim ‘Heart of Stone’
- Nhận định, soi kèo U19 Pháp vs U19 Italia, 21h00 ngày 25/3: Trận chiến không khoan nhượng
- Á hậu Phương Nhi đến thăm trẻ em mồ côi Mái ấm Hoa Hồng
- Xét tuyển đại học, đổi mới thi cử chưa thoát khỏi vòng luẩn quẩn?
- Cận cảnh khu nghỉ dưỡng trượt tuyết mới khánh thành của Triều Tiên
- Nhận định, soi kèo El Kanemi vs Shooting Stars, 21h00 ngày 27/3: Chia điểm là hợp lý
- Cuộc sống ở nơi nhiệt kế bị vỡ vì quá lạnh