Data Science and Machine Learning Platform

R – bình phương (R-squared) là gì?

R-bình phương () là phần trăm mức độ dao động của biến đầu ra (response variable) có thể được giải thích bởi mô hình tuyến tính (linear model). luôn nằm trong khoảng 0 tới 100%. là một giá trị đo lường thống kê để đo mức độ gần giữa dữ liệu với đường hồi quy …

R – bình phương (R-squared) là gì? Read More »

Gradient Descent Algorithm in super slow motion

Thuật toán Gradient Descent là thuật toán xương sống của hầu hết các phương pháp học máy hiện đại. Tuy nhiên, việc biểu diễn thuật toán này dưới công thức toán học ( đã ở mức abstract rất cao) khiến phần lớn chúng ta không thể nắm vững được thuật toán này ở instinct level. …

Gradient Descent Algorithm in super slow motion Read More »

Khoá học áp dụng thống kê để giải quyết vấn đề trong công nghiệp

Đây là một khoá học miễn phí của SAS, một công ty hàng đầu về dữ liệu trên thế giới. Công cụ xuyên suốt khoá học là JMP (một phần mềm thống kê dùng trong công việc rất phổ biến trong các ngành công nghiệp. JMP có một ngôn ngữ script riêng gọi là JSL …

Khoá học áp dụng thống kê để giải quyết vấn đề trong công nghiệp Read More »

Giải thích phương trình Bellman

Trong bài viết này, chúng ta sẽ tìm hiểu về phương trình Bellman, phương trình được xem là trung tâm trong nhiều thuật toán của học tăng cường (reinforcement learning). Tác nhân theo hàm giá trị (Value-based Agents) Hãy nhớ rằng mục tiêu của tác nhân (agent) là tìm ra một chuỗi các hành động …

Giải thích phương trình Bellman Read More »

Giải thích q-learning trong học – tăng – cường (reinforcement learning)

Một trong những thuật toán yêu thích mà tôi đã được học khi tham gia khóa học tăng cường (reinforcement learning) là q-learning. Lý do có lẽ là do nó khá dễ hiểu và có thể coding được. Bài viết này sẽ thảo luận về q-learning và thuật toán đằng sau nó. Q-learning là một …

Giải thích q-learning trong học – tăng – cường (reinforcement learning) Read More »

Scroll to Top