Data-centric – Xu hướng chuyển dịch từ tập trung code sang dữ liệu (data)

Trong Workshop chia sẻ tại Lễ Khai giảng chương trình Thạc sĩ Kỹ thuật phần mềm – Đại học FPT, khách mời, diễn giả Vương Quân Ngọc – Giám đốc Chuyển đổi số của FPT Digital đã đề cập đến một khái niệm đang là xu hướng mới trong lĩnh vực AI. Đó là Data Centric.

Ông Vương Quân Ngọc - Giám đốc Chuyển đổi số của FPT Digital
Ông Vương Quân Ngọc – Giám đốc Chuyển đổi số của FPT Digital

Để hiểu rõ về khái niệm này, đầu tiên chúng ta hãy quay lại cấu trúc cơ bản của AI (trí tuệ nhân tạo): AI = code + data

Như vậy, về cơ bản AI được xây dựng kết hợp bởi code và data. Trên thực tế, phần lớn các mô hình, thuật toán đều được triển khai code (cách làm) tương tự nhau. Vậy điểm vượt trội của kết quả nằm ở phần dữ liệu (Data) đầu vào. Một nguyên lý đơn giản là lượng data đầu vào (input) càng lớn, càng tin cậy (Chất lượng) tỉ lệ thuận với kết quả cho ra (output).

Ông Vương Quân Ngọc chia sẻ tại Lễ Khai giảng MSE Đại học FPT
Điểm vượt trội ở kết quả hiện nay thường đến từ dữ liệu đầu vào

Rule-Based Machine Learning là gì?

“Rule-Based Machine Learning” (RBML) là một phương pháp trong lĩnh vực machine learning mà các quy tắc (rules) được sử dụng để tạo ra và giải quyết mô hình. Mô hình này dựa trên quy luật logic hoặc quy tắc điều kiện-hành động (if-then).

Các quy tắc thường được xây dựng từ dữ liệu đào tạo và có thể được hiểu và giải thích dễ dàng bởi con người. Mỗi quy tắc thường mô tả một quan hệ giữa một tập hợp các điều kiện và một hành động cụ thể. Mô hình này thích hợp cho các vấn đề mà quy luật hay nguyên tắc đã được biết đến và có thể được diễn giải bởi chuyên gia trong lĩnh vực đó.

RBML thường được sử dụng trong các ứng dụng nơi mà sự giải thích và hiểu biết của mô hình là quan trọng. Ví dụ, trong lĩnh vực y tế, RBML có thể được sử dụng để tạo ra các hệ thống hỗ trợ quyết định dựa trên các quy tắc y khoa.

Mặc dù RBML mang lại sự giải thích và diễn giải, nhưng đôi khi nó có thể thiếu khả năng học linh hoạt từ dữ liệu so với các phương pháp khác như học máy dựa trên mô hình.

Ông Vương Quân Ngọc chia sẻ tại Lễ Khai giảng MSE Đại học FPT
Rule-Based Machine Learning hiện nay đang được thay thế bởi data centric

Data Centric là gì?

Thuật ngữ “data-centric” (tạm dịch là “trung tâm dữ liệu”) thường được sử dụng để mô tả một cách tiếp cận trong quản lý thông tin và phân tích dữ liệu. Cụ thể, nó liên quan đến việc đặt dữ liệu làm trung tâm của quá trình ra quyết định, phân tích, và xử lý thông tin.

Hiểu một cách đơn giản, data centric là việc xây dựng hệ thống tập trung vào dữ liệu thay vì code. Đây là xu hướng mới thay thế cho phương pháp truyền thống là Rule-Base Machine Learning.

Ông Vương Quân Ngọc chia sẻ tại Lễ Khai giảng MSE Đại học FPT
Data centric là cách lập trình tập trung vào dữ liệu thay vì code

Ứng dụng của data centric:

Mới đây, Tiến sĩ Andrew Ng – chuyên gia hàng đầu về trí tuệ nhân tạo (AI) và lãnh đạo, chuyên gia của FPT cùng các công ty sản xuất hàng đầu thế giới đã cùng chia sẻ về xu hướng và cơ hội ứng dụng Data-centric vào kiểm định lỗi cho dây chuyền sản xuất, tăng cường khả năng cạnh tranh cho nhà máy.

Tiến sĩ Andrew Ng - Đồng sáng lập và Tổng Giám đốc Landing AI trao đổi cùng ông Trương Gia Bình - Chủ tịch HĐQT Tập đoàn FPT, ông Nguyễn Khải Hoàn - Phó Tổng Giám đốc FPT Software và ông Nguyễn Xuân Phong - Giám đốc Trí tuệ nhân tạo FPT Software
Tiến sĩ Andrew Ng – Đồng sáng lập và Tổng Giám đốc Landing AI trao đổi cùng ông Trương Gia Bình – Chủ tịch HĐQT Tập đoàn FPT, ông Nguyễn Khải Hoàn – Phó Tổng Giám đốc FPT Software và ông Nguyễn Xuân Phong – Giám đốc Trí tuệ nhân tạo FPT Software

Việc ứng dụng AI vào tất cả các bước vận hành nhà máy được coi là bước phát triển tiếp theo của ngành sản xuất. Công nghệ này giúp tăng năng suất và hiệu quả hoạt động 24/7, thúc đẩy cạnh tranh trên thị trường, đồng thời tối ưu nhân lực giúp giảm chi phí đầu vào, từ đó giảm giá thành sản phẩm.

Cụ thể, trên mảng kiểm định chất lượng, hướng data-centric tăng năng lực kiểm định trong thời gian thực là điều các diễn giả quan tâm.

Phần lớn các hệ thống này không thể “tự học” thông tin mới, chỉ kiểm định đúng lỗi theo chỉ định dẫn đến nhận diện sai và cần kiểm tra thủ công. Thêm vào đó, giữa các dây chuyền và phân xưởng có vô vàn sự khác biệt nhỏ, thách thức cả nhà máy lẫn kỹ sư công nghệ phải tập hợp chi tiết các trường hợp để viết đủ quy tắc.

Tuy vậy, theo chia sẻ của đại diện một công ty sản xuất lớn tại sự kiện, khi thay thế sang công nghệ AI mới, công ty gặp nhiều khó khăn khi ứng dụng AI vào các dây chuyền sẵn có, cũng như thuyết phục nhân sự sản xuất thay đổi. “Chúng tôi không có đủ người có bằng Tiến sĩ để dùng các công nghệ này, chúng tôi cần công nghệ thân thiện, dễ dàng cho nhân sự ngay tại tầng sản xuất sử dụng“, vị đại diện này cho biết thêm.

Tiến sĩ Andrew Ng (trên màn hình) là Đồng sáng lập Coursera, Đồng sáng lập và cựu Trưởng bộ phận Google Brain và nguyên Nhà khoa học trưởng Baidu.
Tiến sĩ Andrew Ng (trên màn hình) là Đồng sáng lập Coursera, Đồng sáng lập và cựu Trưởng bộ phận Google Brain và nguyên Nhà khoa học trưởng Baidu.

Đây là nơi các nền tảng theo hướng data-centric phát huy lợi thế. Nền tảng này tối ưu chất lượng nguồn dữ liệu đầu vào để huấn luyện AI thay vì tập trung vào mô hình thuật toán. Theo Tiến sĩ Andrew Ng: “Như vậy, từ những Tiến sĩ máy tính đến người chỉ biết một chút lập trình đều có thể phát triển được AI, vì data-centric cho phép người có khả năng xử lý dữ liệu là có thể sử dụng được“.

Chương trình Thạc sĩ Kỹ thuật phần mềm (MSE) tại Đại học FPT là một trong số ít chương trình đào tạo Thạc sĩ định hướng chuyên sâu về AI và phân tích dữ liệu tại Việt Nam. Chương trình được trường Đại học FPT nghiên cứu và tiến hành triển khai dưới sự hỗ trợ đào tào từ phía FPT Software, mang đến cho học viên cơ hội học tập chuyên sâu, thực tế thông qua tham gia trực tiếp các dự án cùng chuyên gia tại đây. 

Tìm hiểu thông tin chương trình tại https://caohoc.fpt.edu.vn/fsb/mse/ hoặc qua hotline: 090 459 55 77

Trả lời

Email của bạn sẽ không được hiển thị công khai. Các trường bắt buộc được đánh dấu *