Tinh hoa Việt

Chuyện quanh… thuật toán

HUY THẮNG • 08/07/2024 17:17

Dạo này mấy đứa cháu trong nhà tôi hay nói đến chữ “thuật toán”.

Các tập đoàn công nghệ đều sử dụng thuật toán.

“Facebook có thuật toán gì đó, anh vừa mới tìm kiếm về chiếc mũ lưỡi chai lúc sau trên Newsfeed hiện lên rất nhiều trang bán mũ”, người anh nói.

Cô em gái cũng đáp: “Em cũng thế, tối qua vừa nói chuyện trên Facetime với bạn về đồ bơi, lúc sau vào Facebook tràn ngập shop bán đồ bơi. Họ có thuật toán gì đó để theo dõi hành vi người dùng…”

Thuật toán bước vào cuộc sống thường ngày

Lắng nghe bọn trẻ đối thoại, tôi lại nhớ tới cuối tuần trước, mấy ông bạn già trong khu phố cũng nói về thuật toán trên Facebook. Một ông có vẻ thông thạo, bảo rằng mạng xã hội có “thiết bị” theo dõi hành vi người dùng. Ông khác thì nói đùa mà như thật: “Facebook như có “mắt thần”. Mình làm cái gì “chúng” cũng biết…”.

Thực tế thì các tập đoàn công nghệ đều sử dụng thuật toán. Từ ứng dụng truyền thông xã hội đến Netflix, các thuật toán tìm hiểu sở thích của người dùng và ưu tiên nội dung được hiển thị đối với mỗi cá nhân. Google Maps và trí tuệ nhân tạo (AI) sẽ vô nghĩa nếu không có thuật toán.

Facebook cũng không ngoại lệ. Mạng xã hội này với khoảng 3,2 tỷ người dùng trên toàn thế giới có thuật toán riêng. Ra đời năm 2004 từ ký túc xá Đại học Harvard (Mỹ), sau đó Facebook lan rộng ra các trường đại học ở Mỹ trước khi trở thành mạng xã hội lớn nhất thế giới.

Thuật toán Facebook là một hệ thống phức tạp và đa chiều được Facebook sử dụng để xác định và điều chỉnh cách nội dung được hiển thị trên News feeds và phân phối trên nền tảng mạng xã hội này. Mục tiêu chính của thuật toán là đưa ra những nội dung có khả năng tương tác cao và phù hợp với sở thích của người dùng.

Nói một cách đơn giản, thuật toán Facebook hoạt động như một bộ lọc, giúp sắp xếp và chọn lọc hàng triệu bài đăng được chia sẻ mỗi ngày nhằm hiển thị những nội dung liên quan nhất cho mỗi người dùng. Hay nói cách khác, thuật toán Facebook sẽ chấm điểm, lựa chọn và cân nhắc nội dung phù hợp đối với thói quen và sở thích cũng như nhu cầu tìm kiếm để quyết định người dùng sẽ thấy những thông tin gì khi lướt bảng tin của mình.

Thuật toán của Facebook tiến hành việc thu thập mọi thông tin của người dùng trên nền tảng, bao gồm: các nội dung bạn tương tác, thích, bình luận, chia sẻ, mọi người mà bạn tương tác và kể cả thời gian bạn dành cho từng bài post.

Sau bước thu thập thông tin, Facebook tiến hành phân tích tệp dữ liệu đó nhằm hiểu hơn về sở thích và hành vi của bạn. Từ những phân tích dựa theo tệp dữ liệu đã thu thập được, Facebook bắt đầu đánh giá và xếp hạng dựa trên giá trị cụ thể mà từng bài đăng có thể mang đến cho người dùng.

Một năm trước, tháng 6/2023, Nick Clegg - Chủ tịch phụ trách vấn đề toàn cầu của Meta (công ty mẹ của Facebook), tiết lộ, hàng tỷ người dùng lên Facebook và Instagram mỗi ngày để chia sẻ những câu chuyện, kết nối với người cùng sở thích và khám phá nội dung. “Để trải nghiệm mỗi người được cá nhân hóa hơn, chúng tôi dùng AI để quyết định nội dung nào sẽ xuất hiện trên bảng tin", Nick Clegg viết trên blog của công ty.

Nick Clegg cho rằng với tiến bộ vượt bậc của AI, mọi người vừa hào hứng vừa lo sợ, nên cách tốt nhất để giải quyết những lo ngại này là thẳng thắn và cởi mở. Đại diện Meta cũng không giấu giếm khi chia sẻ, hầu hết nội dung trên Facebook, Instagram được chia làm 22 "thẻ hệ thống".

Mỗi thẻ chứa thông tin chi tiết về cách AI xếp hạng và đề xuất nội dung. Thuật toán sẽ dự đoán giá trị của tin tức với từng người dùng, từ đó quyết định cái gì sẽ được ưu tiên xuất hiện ở vị trí tốt.

Đầu tiên, AI phân tích hành vi, thói quen, sở thích của mỗi người từ những bài họ đăng hoặc chia sẻ lại. Hệ thống sẽ xếp bài đăng vào một trong 22 thẻ tương ứng.

Từ đó, AI lựa chọn nội dung cùng loại để phân phối ngược lại trên bảng tin của người dùng. Tuy nhiên, Meta cũng lưu ý họ dùng một số thuật toán, thước đo khác để phân phối thông tin chứ không chỉ dựa vào 1-2 phép tính đơn giản. Ví dụ, AI còn đánh giá bài viết đó có giá trị với người dùng không để tiếp tục đề xuất những bài khác trong tương lai.

"Chúng tôi kết hợp các yếu tố để dự đoán nội dung gần nhất với sở thích người dùng. Nhiều thuật toán dựa vào hành vi, số khác lại dựa trên các khảo sát và phản hồi của người dùng", Nick Clegg nói.

“Ông tổ” của thuật toán là ai?

Vậy thuật toán (algorithm) là gì? Ai là “ông tổ” của thuật toán? Ngày trước, trong quá trình đi học, các thầy cô giáo cũng đã giảng về thuật toán. Khái niệm thuật toán đã có từ rất lâu rồi.

Trong toán học và khoa học máy tính, một thuật toán, còn gọi là giải thuật, là một tập hợp hữu hạn các hướng dẫn được xác định rõ ràng, có thể thực hiện được bằng máy tính, thường để giải quyết một lớp vấn đề hoặc để thực hiện một phép tính. Các thuật toán luôn rõ ràng và được sử dụng chỉ rõ việc thực hiện các phép tính, xử lý dữ liệu, suy luận tự động và các tác vụ khác.

“
Thuật toán trí tuệ nhân tạo đọc suy nghĩ con người
Cuối năm 2023, các nhà khoa học đã phát triển thuật toán trí tuệ nhân tạo (AI) đọc suy nghĩ con người đầu tiên trên thế giới, có thể dịch sóng não thành văn bản.
Theo trang Daily Mail (Anh), thuật toán AI này hoạt động bằng cách sử dụng một chiếc mũ bảo hiểm gắn cảm biến để phân tích hoạt động điện cụ thể trong não của con người khi suy nghĩ, sau đó chuyển những suy nghĩ đó thành văn bản.
Công nghệ mang tính cách mạng này do nhóm nghiên cứu tại Đại học Công nghệ Sydney dẫn đầu. Các nhà khoa học cho rằng phát minh mới có thể cách mạng hóa nỗ lực chăm sóc những bệnh nhân bị câm do đột quỵ hoặc liệt.
Nhóm nghiên cứu cũng tin rằng thiết bị mới sẽ cho phép điều khiển liền mạch các thiết bị, chẳng hạn chân tay sinh học và robot, giúp con người đưa ra chỉ dẫn chỉ bằng cách nghĩ về chúng.
Giáo sư trưởng nhóm nghiên cứu CT Lin cho biết: “Nghiên cứu này thể hiện nỗ lực tiên phong trong việc giải mã sóng EEG thô trực tiếp thành ngôn ngữ, đánh dấu bước đột phá đáng kể trong lĩnh vực này. Đây là lần đầu tiên chúng tôi kết hợp các kỹ thuật mã hóa rời rạc trong quá trình dịch tín hiệu não sang văn bản, giới thiệu cách tiếp cận sáng tạo để giải mã thần kinh. Việc tích hợp với các mô hình ngôn ngữ cũng đang mở ra những biên giới mới trong khoa học thần kinh và AI”.

Là một phương pháp hiệu quả, một thuật toán có thể được biểu diễn trong một khoảng không gian và thời gian hữu hạn, và bằng một ngôn ngữ hình thức được xác định rõ ràng để tính toán một hàm số. Bắt đầu từ trạng thái ban đầu và đầu vào ban đầu (có thể trống),các hướng dẫn mô tả một phép tính, khi được thực thi, sẽ tiến hành qua một số hữu hạn các trạng thái kế tiếp được xác định rõ, cuối cùng tạo ra "đầu ra" và chấm dứt ở trạng thái kết thúc cuối cùng.

Sự chuyển đổi từ trạng thái này sang trạng thái tiếp theo không nhất thiết phải mang tính xác định; một số thuật toán, được gọi là thuật toán ngẫu nhiên, kết hợp đầu vào ngẫu nhiên.

Khái niệm thuật toán đã tồn tại từ thời cổ đại. Hơn 1.000 năm trước khi có internet và điện thoại thông minh, nhà thông thái người Ba Tư Muhammad ibn Musa al-Khwarizmi đã phát minh ra khái niệm thuật toán. Trên thực tế, bản thân từ thuật toán (algorithm) xuất phát từ phiên bản Latinh tên của ông.

Al-Khwarizmi sống từ năm 780 đến 850 Công nguyên. Ông được coi là “cha đẻ của đại số” và đối với một số người, Al-Khwarizmi còn là “ông tổ của khoa học máy tính”. Tuy nhiên, có rất ít thông tin còn được lưu giữ về cuộc đời của ông. Nhiều nghiên cứu gốc bằng tiếng Arab của Al-Khwarizmi đã thất lạc theo thời gian. Người ta tin rằng Al-Khwarizmi sinh ra ở vùng Khwarazm phía Nam Biển Aral thuộc Uzbekistan ngày nay.

Al-Khwarizmi đã có những đóng góp quan trọng cho toán học, địa lý, thiên văn học và lượng giác. Ông còn tìm ra các phép tính để theo dõi chuyển động của Mặt Trời, Mặt Trăng và các hành tinh. Ông cũng viết về các hàm lượng giác.

Al-Khwarizmi là học giả tại Ngôi nhà Trí tuệ (Bayt al-Hikmah) ở Baghdad. Đây là viện nghiên cứu khoa học cao cấp đầu tiên trong lịch sử của thế giới Hồi giáo.

Tại Bayt al-Hikmah, các học giả dịch kiến thức từ khắp nơi trên thế giới sang tiếng Arab, rồi tổng hợp nó để đạt được tiến bộ trong nhiều lĩnh vực khác nhau, trong đó có toán học.

Một trong những dự án lớn mà các nhà toán học Hồi giáo thực hiện tại Bayt al-Hikmah là phát triển đại số. Khoảng năm 830 Công Nguyên, Khalip (Quốc vương nước Hồi giáo) al-Ma'mun (813–833) khuyến khích Al-Khwarizmi viết một chuyên luận về đại số. Sau đó, nó đã trở thành sản phẩm quan trọng nhất của ông.

Ở thời điểm đó, “đại số” đã tồn tại hàng trăm năm, nhưng Al-Khwarizmi là người đầu tiên viết một cuốn sách rõ ràng về nó. Nghiên cứu của ông nhằm tạo ra một công cụ giảng dạy thực tế. Bản dịch tiếng Latin của cuốn sách là nền tảng cho sách giáo khoa đại số ở các trường đại học châu Âu cho đến thế kỷ 16.

Trong phần đầu tiên, ông giới thiệu các khái niệm và quy tắc đại số cũng như các phương pháp tính thể tích và diện tích các hình. Đến phần thứ hai, ông đưa ra những vấn đề thực tế và giải pháp, chẳng hạn như các trường hợp thừa kế, phân chia đất đai và tính toán thương mại. Al-Khwarizmi không sử dụng ký hiệu toán học thời hiện đại, thay vào đó, ông viết bằng văn xuôi đơn giản và dùng biểu đồ hình học.

Ví dụ như nội dung: “Nghiệm của bốn bằng hai mươi, một nghiệm bằng năm và bình phương được tạo thành từ nó là hai mươi lăm”. Theo ký hiệu hiện đại, chúng ta sẽ viết như sau: 4x = 20, x = 5, x2 = 25.

Các tác phẩm toán học của Al-Khwarizmi đã giới thiệu chữ số Hindu-Arab với các nhà toán học phương Tây. Chúng là 10 ký hiệu mà tất cả chúng ta sử dụng ngày nay: 1, 2, 3, 4, 5, 6, 7, 8, 9, 0. Các chữ số Hindu-Arab rất quan trọng đối với lịch sử máy tính vì chúng sử dụng số 0 và hệ thập phân. Đây là hệ thống số làm nền tảng cho công nghệ tính toán hiện đại.

Nghệ thuật tính toán các vấn đề toán học của Al-Khwarizmi đã đặt nền tảng cho khái niệm thuật toán. Ông đã đưa ra những giải thích chi tiết đầu tiên về cách sử dụng ký hiệu thập phân để thực hiện bốn phép tính cơ bản (cộng, trừ, nhân, chia).

Đây là phương pháp tính toán hiệu quả hơn so với việc sử dụng bàn tính. Để giải một phương trình toán học, Al-Khwarizmi đã chuyển đổi có hệ thống qua một chuỗi các bước để tìm ra câu trả lời. Đây là khái niệm cơ bản cho thuật toán.

Ngày nay, từ "thuật toán" có định nghĩa: “Một tập hợp các hướng dẫn hoặc quy tắc toán học sẽ giúp tính câu trả lời cho một bài toán”.

Ông Al-Khwarizmi đóng vai trò quan trọng trong sự phát triển của toán học và khoa học máy tính như chúng ta biết ngày nay. Bất kỳ công nghệ kỹ thuật số nào ngày nay, từ mạng xã hội đến tài khoản ngân hàng trực tuyến, sẽ không thể thực hiện được nếu không có công trình tiên phong của một học giả Ba Tư cổ đại.

Ông Stefan Mandel - người trúng số 14 lần nhờ thuật toán. Ảnh: Twitter.

14 lần trúng số nhờ thuật toán

Để kết thúc bài tổng hợp về thuật toán, tôi xin kể một câu chuyện liên quan đến một người đàn ông rất thông minh ở Romania. Vào thập niên 1990, nhà kinh tế học trẻ tuổi người Romania - ông Australia Stefan Mandel chật vật tìm cách sống qua ngày. Khi đó, mức lương của Mandel chỉ ở khoảng 10 USD/tháng, không đủ để đáp ứng nhu cầu tối thiểu.

Ông cần một cách kiếm nhiều tiền nhanh chóng và quyết định mua xổ số. Có tư duy bẩm sinh với những con số, Mandel dành tất cả thời gian rảnh rỗi phân tích những bài báo về lý thuyết xác suất của nhà toán học thế kỷ 13 Leonardo Fibonacci. Sau nhiều năm nghiên cứu, ông viết một "thuật toán chọn số" dựa trên phương pháp gọi là "combinatorial condensation".

Theo đó, nếu một người chơi chọn 6 số trong dãy số từ 1 đến 49, tỷ lệ thắng giải là 1/13.983.816. Nếu người đó chọn 15 số, cơ hội thắng giải tăng lên 1/2.794. Với thuật toán của mình, Mandel chắc chắn ít nhất ông có thể trúng giải nhì cùng hàng trăm giải thưởng nhỏ hơn và khả năng trúng giải độc đắc là 1/10. Mandel hợp tác với 4 người bạn, mỗi người mua 228 vé số.

Ông may mắn trúng giải độc đắc trị giá khoảng 2.000 USD thời đó. Sau khi trừ chi phí, ông có đủ tiền để đưa vợ con ra nước ngoài. Sau 4 năm lang thang khắp châu Âu, Mandel định cư ở Australia và bắt đầu chơi xổ số theo cách khác.

Mandel nhận ra một điều: Trong một số giải xổ số, giải độc đắc cao gấp ba lần chi phí mua mọi bộ số có thể. Ví dụ, giải xổ số yêu cầu chọn 6 số trong dãy từ 1 đến 40, tức là có thể tạo ra 3.838.380 bộ số. Với giá 1 USD một vé số, nếu mua tất cả bộ số có thể, người chơi sẽ tốn hơn 3,8 triệu USD. Nhưng nếu giải độc đắc là 10 triệu USD thì sau khi trừ đi tiền thuế, người chơi vẫn "lãi" lớn.

Trong giải xổ số thông thường, một bộ số được lựa chọn ngẫu nhiên từ dãy số, ví dụ như từ 1 đến 50. Nếu người chơi chọn bộ số khớp với kết quả, họ sẽ chiến thắng. Nhưng Mandel nhận thấy ở một số giải sổ số, giải độc đắc cao gấp 3 lần chi phí mua mọi bộ số có thể.

Chiến lược của Mandel thành công. Ông cùng các nhà đầu tư trúng số 12 lần trong những năm 1980 tại Australia. Tuy nhiên, cách làm của ông nhanh chóng bị giới chức Australia chú ý. Họ ra thêm nhiều quy định và luật mới để ngăn Mandel tiếp tục làm chủ vận may. Nhưng 13 lần trúng số tại Australia và Romania là chưa đủ với Mandel, ông nhắm mục tiêu vào xổ số bang Virginia tại Mỹ.

Qua một khoảng thời gian, Mandel thuyết phục hàng trăm nhà đầu tư gom tiền và cam kết chia tiền cho họ nếu trúng giải. Sau đó, ông phát triển một hệ thống tự động. Đó là căn phòng chứa đầy máy in và máy tính chạy theo thuật toán in ra mọi bộ số có thể tồn tại. Máy tính giúp cách mạng hóa quy trình của Mandel.

Trước đây, ông bị hạn chế khi phải viết tay hàng triệu tổ hợp, một lỗi nhỏ có thể phá hủy công sức làm việc suốt 8 tháng. Nhưng sau này ông có thể giao phó công việc cho một cỗ máy.

Vào thời điểm đó, giải xổ số ở bang Virginia có một số lợi thế. Do còn tương đối mới, người chơi được phép mua vé số với số lượng không giới hạn và được tự in tại nhà, sau đó mang đến các cơ sở như cửa hàng, trạm xăng để thanh toán. Điều quan trọng nhất là dãy số chỉ giới hạn từ 1 đến 44 (các bang khác lên tới 54). Người chơi chọn 6 con số từ dãy đó, tương ứng với 7.059.052 bộ số, ít hơn rất nhiều so với mức thông thường là 25 triệu bộ số. Với giá 1 USD/vé, Mandel cần chi gần 7,1 triệu USD để chắc chắn có chiếc vé trúng giải.

Mandel thuyết phục được 2.560 nhà đầu tư hùn tiền. Tại một nhà kho ở Melbourne, Australia, ông bố trí 30 máy tính và 12 máy in laser, đồng thời thuê 16 nhân viên toàn thời gian để in hàng triệu vé số với mọi bộ số có thể trong quá trình kéo dài 3 tháng. Sau đó, ông vận chuyển một tấn vé số tới Virginia, Mỹ với chi phí 60.000 USD.

Tuy nhiên, Mandel phải chờ giải độc đắc đạt giá trị đủ cao để có lãi sau khi trừ đi thuế, chi phí và trả lãi cho nhà đầu tư. Vào thứ Tư, ngày 12/2/1992, giải xổ số Virginia treo thưởng lên tới 15,5 triệu USD, Mandel và cộng sự quyết định hành động. Phiên quay số diễn ra vào thứ 7, nghĩa là họ có ba ngày để mua 7,1 triệu vé số.

Mandel nhờ doanh nhân Anithalee Alex Jr. điều hàng chục người tới trạm xăng và cửa hàng tạp hóa để thanh toán tất cả chỗ vé số đó bằng séc. Quá trình diễn ra suôn sẻ trong hai ngày. Tuy nhiên, vào ngày cuối cùng, vài giờ trước khi hết hạn, một cơ sở ngừng thanh toán vé số cho họ. Họ không thể sở hữu 140.000 vé số (tương ứng 700 bộ số). Cuối cùng, trong tay họ chỉ có khoảng 6,4 triệu bộ số. Kết quả thắng giải vẫn phụ thuộc một phần vào may mắn.

Ngày 15/2/1992, may mắn đã mỉm cười với Mandel và cộng sự, họ trúng giải độc đắc 27 triệu USD và còn thắng thêm gần 1 triệu USD từ các giải thấp hơn. Sau khi trừ thuế và chi phí, mỗi nhà đầu tư nhận được khoảng 1.400 USD, riêng Mandel tự trả phí tư vấn cho ông là 1,7 triệu USD. Tổng cộng 14 cơ quan quốc tế, chủ yếu là Australia và Mỹ, bắt tay điều tra Mandel. Cuối cùng, họ kết luận Mandel không phạm pháp.

“
Dùng AI tăng cường thuật toán
Meta đang áp dụng trí tuệ nhân tạo (AI) để tăng cường thuật toán đề xuất video trên Facebook, nhằm cạnh tranh với đối thủ TikTok. Công ty đã chuyển đổi Reels sang mô hình AI mới, khiến thời lượng xem tăng đáng kể.
Cụ thể, Facebook đang nâng cấp cách thức đề xuất video trên các nền tảng Reels, nhóm và bản tin chính bằng cách sử dụng trí tuệ nhân tạo để điều khiển thuật toán đề xuất. Thông tin này được ông Tom Alison, người đứng đầu Facebook thông báo tại hội nghị công nghệ Morgan Stanley 2024 diễn ra hôm 6/3 ở San Francisco (Mỹ).
Động thái này nhằm cạnh tranh với TikTok, ứng dụng phát triển mạnh mẽ tại Mỹ trong những năm gần đây, nổi tiếng với khả năng đề xuất video cuốn hút người dùng dựa trên thuật toán học máy mạnh mẽ. Trong thử nghiệm trên Reels, thời lượng xem video đã tăng từ 8-10% nhờ sử dụng mô hình AI mới. "Điều này cho thấy kiến trúc mô hình mới học hỏi từ dữ liệu hiệu quả hơn thế hệ trước" ông Alison nhận định.
Facebook cũng dự định áp dụng công nghệ này ở tất cả các nơi hiển thị video, bao gồm bản tin chính và nhóm, theo "lộ trình công nghệ" của công ty đến năm 2026.
Trước đây, Facebook sử dụng các hệ thống đề xuất video khác nhau cho Reels, nhóm và bản tin chính. Tuy nhiên, sau thành công bước đầu với Reels, công ty sẽ chuyển sang dùng cùng một mô hình AI cho tất cả sản phẩm hiển thị video. Theo ông Alison, nếu triển khai thành công, việc đề xuất sẽ hấp dẫn hơn, độ phản hồi cũng được cải thiện.
Bước đi này là một phần chiến lược của Meta nhằm ứng dụng AI vào tất cả sản phẩm sau sự thành công của ChatGPT của OpenAI. Meta đang chi hàng tỉ USD để mua hàng trăm nghìn GPU NVIDIA đắt tiền, dùng đào tạo và vận hành các mô hình AI mới.

HUY THẮNG