Học sinh THPT xây dựng hệ thống AI xếp hạng nghiên cứu khoa học
Vượt qua 5.000 ý tưởng, "Hệ thống chỉ số và phân tích tổ chức được tăng cường bằng Công nghệ máy - Trí tuệ nhân tạo với tính minh bạch cao" (Metrixa) của đội Starfox - đội tuyển Tin học Trường THPT Chuyên Khoa học tự nhiên đã xuất sắc giành giải Triển vọng cuộc thi Data for Life 2025 vừa được trao trong tháng 12.

Đội Starfox gồm 8 học sinh của Trường THPT Chuyên Khoa học Tự nhiên (Đại học Khoa học Tự nhiên, Đại học Quốc gia Hà Nội) là Đoàn Gia Huy (12A1), Trần Bảo Khánh (12A3), Vũ Minh Duy (11A2), Nguyễn Minh Đức (11A3), Nguyễn Đình Bách (11A1), Đinh Nguyên Khôi (11A2), Nguyễn Hữu Tuấn (12A3), Lê Phạm Duy Khoa (12A1). Các em đã vượt qua hơn 2.600 đội thi, 9.100 thí sinh đến từ các trường đại học, viện nghiên cứu, cơ quan và doanh nghiệp trên toàn quốc để trở thành 1 trong 30 đội bước vào vòng chung kết của cuộc thi.
Đại diện của nhóm chia sẻ niềm vui khi có mặt tại vòng chung kết sau nhiều vòng thi khắt khe. Và niềm hạnh phúc càng vỡ òa hơn khi những “thí sinh nhí” này đã xuất sắc giành giải Triển vọng ở một sân chơi trí tuệ bằng giải pháp Metrixa. “Đó gần như là một điều không tưởng đối với chúng em, những học sinh cấp 3 và vẫn còn đang dành phần lớn thời gian để học tập” – Khánh nói.
Chia sẻ về đứa con tinh thần Metrixa, các em cho biết đây là một hệ thống AI đầu tiên ở Việt Nam có thể tự động thu thập, phân tích và trực quan hóa dữ liệu hàng chục nghìn bài báo khoa học, tạo nên bản đồ nghiên cứu 3D giúp đánh giá năng lực khoa học của các tổ chức một cách minh bạch và chính xác hơn.
Cụ thể, sản phẩm có hai phần chính. Phần thứ nhất là một biểu đồ không gian ba chiều, biểu diễn các bài báo khoa học của Việt Nam. Mỗi điểm trong không gian ba chiều tương ứng với một bài báo, và màu sắc của điểm thể hiện chuyên ngành nghiên cứu của bài báo đó.
Phần thứ hai là bảng xếp hạng. Nhóm đã tổng hợp toàn bộ các bài báo khoa học, tiến hành đánh giá và xây dựng thang điểm cho các tổ chức, trường đại học. Từ đó có thể xếp hạng những tổ chức, trường đại học có mức độ đóng góp lớn cho các lĩnh vực nghiên cứu tại Việt Nam.
Xuất phát từ thực tế hiện nay, các bảng xếp hạng ở Việt Nam chủ yếu tập trung vào cơ sở vật chất và chất lượng giảng dạy của các trường đại học, tổ chức, đội Starfox lựa chọn hướng tiếp cận khác. Đó là dựa trên hoạt động nghiên cứu khoa học. Dữ liệu được sử dụng là các bài báo khoa học từ các tổ chức, trường đại học đã được công bố quốc tế. Dữ liệu được cập nhật và chuẩn hóa tự động từ các kho học thuật lớn như Semantic Scholar và S2ORC, hai nguồn được giới nghiên cứu quốc tế đánh giá cao về độ tin cậy.
Về đối tượng mà METRIXA hướng tới, nhóm chia sẻ: đối với nhà nước, hệ thống cung cấp dữ liệu để theo dõi tiến độ nghiên cứu khoa học một cách nhất quán và có cơ sở; đối với nhà nghiên cứu, nền tảng cho phép tìm cộng sự, phát hiện các nhóm nghiên cứu liên ngành và nhận diện xu hướng khoa học mới còn với học sinh, sinh viên, biểu đồ 3D giúp họ quan sát sự phân bổ của các lĩnh vực tại Việt Nam, từ đó định hướng ngành nghề phù hợp hơn.
Từ ý tưởng ban đầu đến khi giải pháp hoàn thiện, cả nhóm đã nhận được sự hỗ trợ, hướng dẫn nhiệt tình của các thầy cô. Trong đó, từng nhiệm vụ được chia nhỏ và phân công cho từng thành viên trong nhóm phụ trách. Một trong những khó khăn đối với các em chính là phải tự học rất nhiều kiến thức mà chương trình phổ thông không đề cập đến, trong đó có các khoá AI từ cơ bản đến nâng cao… Bên cạnh đó, lượng bài vở trên lớp không hề nhỏ nên các thành viên trong nhóm phải sắp xếp thời gian hợp lý, tận dụng những giờ rảnh rỗi để tự nạp kiến thức cần thiết và trao đổi, cùng tìm cách giải cho các vấn đề phức tạp của hệ thống cũng như xin ý kiến định hướng, góp ý từ thầy cô.
Thời gian tới, nhóm sẽ tiếp tục nghiên cứu để hoàn thiện hơn giải pháp này, trong đó hướng đi cụ thể bao gồm sẽ cải thiện công thức tính toán để bảng xếp hạng trở nên chính xác và toàn diện hơn. Nhóm cũng đặt mục tiêu so sánh nghiên cứu giữa Việt Nam và thế giới đồng thời mong muốn giảm thiểu chi phí hoạt động ở mức tối đa để đảm bảo tính bền vững lâu dài của sản phẩm.