Học khoa học dữ liệu tại Fulbright

Trường Chính sách Công và Quản lý Fulbright (FSPPM) có bộ môn Khoa học Dữ liệu nhằm xây dựng năng lực dữ liệu cho những người ngoài ngành.

Hơn 95% dữ liệu chúng ta đang có trên toàn thế giới được tạo ra trong khoảng 10 năm trở lại đây, theo thống kê của Statista. Với sự phổ biến của các thiết bị cá nhân hiện đại được kết nối với nhau trong một mạng lưới ngày càng dày đặc, có thể gọi ngày nay là thời đại của dữ liệu.

Đi cùng là xu hướng dùng dữ liệu để giải các bài toán kinh doanh hay bài toán xã hội. Việc ra quyết định dựa trên dữ liệu trở thành một xu hướng không thể đảo ngược trong thời đại này, kể cả ở doanh nghiệp, tập đoàn hay khu vực nhà nước.

Tiến sĩ Huỳnh Nhật Nam, người phụ trách bộ môn Khoa học Dữ liệu trong buổi tuyển sinh của Trường Chính sách công và Quản lý Fulbright. Ảnh: M.H (cho mình xin tên không viết tắt nhé)

Tiến sĩ Huỳnh Nhật Nam, người phụ trách bộ môn Khoa học Dữ liệu trong buổi tuyển sinh của Trường Chính sách công và Quản lý Fulbright (FSPPM). Ảnh: Minh Hòa

Khi nói đến khoa học dữ liệu, người muốn học có thể được phân thành hai nhóm: có chuyên môn về toán - tin và từ các ngành khác. Người ngoài ngành dù muốn tham gia cũng thường lo sợ rằng mình không thể theo kịp trong một lĩnh vực nặng tính kỹ thuật như vậy.

Vì thế, nhiều chương trình đào tạo đang nỗ lực để hóa giải nỗi lo này, trong đó có Trường Chính sách Công và Quản lý Fulbright (FSPPM) thuộc Đại học Fulbright Việt Nam. Tiến sĩ Huỳnh Nhật Nam, người có hơn 10 năm làm việc trong các dự án ứng dụng dữ liệu lớn để giải quyết vấn đề xã hội tại Australia đang là người phụ trách bộ môn Khoa học Dữ liệu tại ngôi trường này.

Khi được hỏi về những khó khăn khi đào tạo nhóm học viên với nền tảng kỹ thuật rất khác nhau, Tiến sĩ Nhật Nam cho rằng sự đa dạng của học viên, (vốn là đặc trưng của FSPPM) là một lợi thế. Ông nói, bản thân mình không đòi hỏi học viên trong lớp Nhập môn Khoa học Dữ liệu có năng lực kỹ thuật gì cả. Thay vào đó, học viên phải vào lớp với một nỗi trăn trở mà họ mong muốn giải quyết và phải nắm được kiến thức căn bản về xác suất thống kê.

"Khi đào tạo khoa học dữ liệu ứng dụng, các bài toán luôn phải gắn với một lĩnh vực cụ thể. Chính sự đa dạng chuyên môn của các học viên, từ tài chính, xây dựng, cho đến luật, báo chí, giáo dục, đã giúp đáp ứng yêu cầu này", Tiến sĩ Nam nói.

Phần còn lại là kiến thức căn bản về xác suất thống kê, vốn đã là một môn học nền tảng của FSPPM - ngôi trường nổi tiếng với khả năng "xóa mù số" cho người ngoài ngành.

Thầy Nhật Nam trong một lớp học về dữ liệu tại FSPPM.

Thầy Nhật Nam trong một lớp học về dữ liệu tại FSPPM. Ảnh: Minh Hòa

Chúng ta thường nghĩ rằng khoa học dữ liệu tương đương với phân tích dữ liệu, nhưng thực tế không phải vậy. Theo thầy Nam, đó chỉ là một phần trong một khái niệm rộng hơn - năng lực dữ liệu (data competency). Xác suất thống kê là một phần không thể thiếu của năng lực này, nhưng để nhập cuộc, người học chỉ cần nắm thật chắc các kiến thức căn bản chứ chưa cần đến những gì cao siêu.

Thầy giải thích, người có năng lực dữ liệu tốt không chỉ biết phân tích dữ liệu hay xây dựng mô hình, mà còn phải biết định hình được đề bài, thiết kế cách giải sao cho khả thi về mặt dữ liệu. Họ cần biết cách tạo ra hoặc tìm dữ liệu ở đâu, đánh giá dữ liệu thế nào là tốt, quản trị và lưu trữ dữ liệu thế nào, cập nhật ra sao. "Bạn sẽ làm những việc này tốt hơn rất nhiều nếu như có hiểu biết chuyên môn trong lĩnh vực đang làm việc", thầy nhấn mạnh.

Việc coi trọng kiến thức chuyên môn (domain knowledge) cũng là xu hướng mà nhiều chuyên gia về khoa học dữ liệu đồng tình. Trong cuốn sách Phân tích Chính sách công: Lập trình và Bối cảnh cho Khoa học Dữ liệu trong Khu vực Công, Tiến sĩ Ken Steif (Đại học Pennsylvania, Mỹ) khẳng định rằng trong việc ứng dụng dữ liệu vào các vấn đề công, một người với kiến thức chuyên môn tốt và năng lực dữ liệu ở mức trung bình có thể đóng góp tốt hơn một nhà khoa học máy tính xuất sắc nhưng chưa từng tìm hiểu các vấn đề xã hội.

Tiến sĩ Huỳnh Nhật Nam nói thêm, kỹ thuật chỉ chiếm nhiều nhất là 1/3 trong toàn bộ quá trình xử lý một bài toán dữ liệu. Hơn nữa, trong bối cảnh ChatGPT đã có thể viết được những đoạn code chính xác theo yêu cầu, thứ tạo ra khác biệt sẽ là khả năng đặt đúng câu hỏi, đánh giá sản phẩm và truyền thông nhằm phối hợp các bên liên quan mà phần lớn sẽ không có chuyên môn kỹ thuật.

Cách đánh giá môn Khoa học Dữ liệu tại FSPPM cũng dần thích ứng với bối cảnh này. "Tôi hướng đến việc không kiểm tra năng lực viết code của học viên nữa, vì chuyện đó họ luôn có thể hỏi ChatGPT. Thứ tôi yêu cầu là học viên phải trình bày được cách mà họ thiết kế lời giải cho bài toán đó", Tiến sĩ Nhật Nam cho biết.

Minh Huy

Link nội dung: https://tiepthivatieudung.vn/hoc-khoa-hoc-du-lieu-tai-fulbright-a16793.html