Xbar-s Control Charts

Xin chào các bạn,

Bài viết này là bài lược dịch tiếng Việt của mình từ bài “Xbar-s Control Charts: Part 1“. Các bạn có thể xem bài viết gốc tại đây. Bài viết gốc thì rất hay trong việc giải thích cách hình thành của Biểu đồ Kiểm soát Xbar-s (tức Xbar-s control chart). Trong bài viết này mình prefer sử dụng các thuật ngữ bằng tiếng Anh nhiều hơn (mặc dù là bài dịch) và sử dụng các thuật ngữ tiếng Việt tương đương ít hơn. Lý do là chủ đề của bài viết này khá liên quan đến full-time job hiện tại của mình và công ty mình thì sử dụng tiếng Anh cho các thuật ngữ này.

Prerequisite

  • Bạn nên có kiến thức căn bản về xác suất thống kê để có thể đọc bài viết một cách hiệu quả, đặc biệt là cần hiểu khái niệm về giá trị trung bình (average)phân phối chuẩn (standard deviation).

Contents

Giới thiệu về \bar{X} - s control charts

Biểu đồ kiểm soát phổ biến nhất nhiều năm trước đây là biểu đồ \bar{X} - R. Biểu đồ này sử dụng range (khoảng giá trị) để đo lường độ dao động của dữ liệu trong một subgroup (nhóm con). Range được tính bằng hiệu số maximum và minimum của dữ liệu. Range là một khái niệm dễ hiểu và dễ tính toán (và đó là lý do nó được yêu thích trước đây khi dữ liệu được tính toán manual và chi phí tính toán máy tính còn quá đắt). Một vấn đề đối với biểu đồ \bar{X} - R là giá trị Range sẽ càng lúc càng thể hiện không chính xác mức độ dao động của subgroup khi kích thước dữ liệu của subgroup tăng lên. Do đó, việc sử dụng một biểu đồ khác thì cần thiết khi kích thước dữ liệu của subgroup tăng – và phương pháp đó chính là biểu đồ \bar{X} - s

Biểu đồ \bar{X} - s được sử dụng cho continuous data. Thời gian, mật độ, cân nặng và độ dài là một vài ví dụ cho dữ liệu dạng continuous. Và cũng giống như các loại biểu đồ kiểm soát khác, chúng ta có hai biểu đồ cho \bar{X} - s control chart. Một biểu đồ cho giá trị trung bình của các subgroup \bar{X} và một biểu đồ cho độ lệch chuẩn (s).

Tìm hiểu về biểu đồ kiểm soát \bar{X} - s

Trước đây, việc sử dụng biểu đồ kiểm soát \bar{X} - s để thay thế cho biểu đồ kiểm soát \bar{X} - R là một việc miễn cưỡng. Độ lệch chuẩn thì không hề dễ hiểu như khoảng giá trị, và việc tính toán độ lệch chuẩn cũng là một một vấn đề.

Nói chung, biểu đồ kiểm soát \bar{X} - s thì tương tự như biểu đồ kiểm soát \bar{X} - R. Điểm khác biệt lớn nhất giữ hai biểu đồ này là việc độ lệch chuẩn của subgroup được sử dụng cho biểu đồ \bar{X} - s, còn khoảng giá trị của subgroup được sử dụng cho biểu đồ \bar{X} - R . Một ưu điểm của việc sử dụng độ lệch chuẩn là giá trị này sẽ đề cập tới mọi điểm giá trị dữ liệu trong subgroup, chứ không chỉ có giá trị lớn nhất và giá trị nhỏ nhất. Các hằng số được sử dụng để tính toán các control limits cũng khác nhau giữa hai biểu đồ.

Biểu đồ bên dưới là một ví dụ về biểu đồ \bar{X} - s. Một công ty đang theo dõi quá trình chạy của một máy đóng bao bì (bagging machine). Mỗi bao cần phải chứa một lượng tối thiểu 50 kg cát. Mười bao cát được cân mỗi giờ để lấy mẫu. Do đó mười bao cát tạo thành một subgroup và kích thước dữ liệu của subgroup này là n = 10. Khối lượng trung bình của mười bao cát được tính toán. Đây chính là giá trị trung bình (\bar{X}) của subgroup. Độ lệch chuẩn của mười bao cát được tính toán và chúng ta có giá trị độ lệch chuẩn (s) của subgroup.

Hình bên dưới là biểu đồ \bar{X}. Các giá trị \bar{X} được thể hiện trên biểu đồ. Có ba đường thẳng được thể hiện trên biểu đồ. Đường ở giữa là đường giá trị trung bình của cả quy trình (overall process average), đường phía trên là đường giới hạn trên (upper control limit) và đường phía dưới là đường giới hạn dưới (lower control limit).

Biểu đồ bên dưới là biểu đồ s. Độ lệch chuẩn của các subgroup được thể hiện trên biểu đồ. Ba đường thẳng được thể hiện trên biểu đồ. Đường ở giữa là độ lệch chuẩn trung bình (\bar{s}). Hai đường thẳng còn lại là đường giới hạn trênđường giới hạn dưới của độ lệch chuẩn.

Quy trình đóng bao bì được thể hiện như trên thì nằm trong statistical control (nằm trong mức kiểm soát thống kê). Biểu đồ \bar{s} nằm trong statistical control, điều này nghĩa là mức độ dao động của từng bao cát thì ổn định theo thời gian. Chúng ta không biết giá trị s tiếp theo là bao nhiêu, nhưng chúng ta biết rằng giá trị đó sẽ nằm giữa 0.06 và 0.34 với một giá trị trung bình về lâu dài là 0.2. Biểu đồ \bar{X} nằm trong statistical control – có nghĩa rằng mức độ dao động của giá trị trung bình của các subgroup thì ổn định theo thời gian. Giá trị \bar{X} tiếp theo sẽ nằm trong khoảng 50.1 và 50.49 với giá trị trung bình về lâu dài là 50.3. Kết luận: quy trình đóng bao bì này thì ổn định và có thể dự đoán được giá trị đầu ra trong một tương lai gần.

Khi nào sử dụng biểu đồ \bar{X} - s

Biểu đồ \bar{X} - s được sử dụng để phân tích hoạt động của một quy trình theo thời gian. Cũng giống như các biểu đồ kiểm soát khác, biểu đồ này sẽ gửi tín hiệu cho chúng ta nếu một có một nguyên nhân đặc biệt (special cause) gây ra sự dao động xuất hiện. Bạn có thể sử dụng biểu đồ \bar{X} - s cho bất kì dữ liệu nào mà kích thước dữ liệu của subgroup lớn hơn 1. Nếu kích thước dữ liệu của subgroup lớn hơn hoặc bằng 10 thì chắc chắn bạn phải nên chọn biểu đồ \bar{X} - s. Độ lệch chuẩn thì thể hiện mức dao động của các data points trong subgroup tốt hơn so với khoảng giá trị.

Dữ liệu phải thường xuyên có sẵn (nhiều mẫu data trong một giờ, một ngày hoặc một tuần). Trong tình huống mà cả biểu đồ \bar{X} - s hay biểu đồ \bar{X} - R đều có thể sử dụng được (nếu kích thước dữ liệu của subgroup nhỏ) thì việc bạn chọn biểu đồ kiểm soát nào hoàn toàn tùy thuộc vào việc bạn thấy cái nào tiện lợi hơn cho mình. Hai dạng biểu đồ kiểm soát này cũng khá tương tự nhau và sẽ giúp bạn rút ra được những kết luận giống nhau.

Các bước để tạo ra được một biểu đồ kiểm soát \bar{X} - s

Tất nhiên là ngày nay các phần mềm máy tính sẽ giúp bạn tạo ra biểu đồ \bar{X} - s. Nhưng việc hiểu được biểu đồ được hình thành qua các bước nào là rất quan trọng để giúp bạn hiểu được vấn đề ở một mức độ sâu hơn (đây là mục đích của bài viết).

1.Thu thập dữ liệu

  • Chọn kích thước dữ liệu của subgroup. Kích thước dữ liệu thông thường của biểu đồ \bar{X} - s10. Tuy nhiên, bạn hoàn toàn có thể sử dụng biểu đồ \bar{X} - s cho bất kì dữ liệu nào có subgroup lớn hơn 1. Bạn nên chú ý thu thập dữ liệu của subgroup đúng phương pháp. Mục đích là để tối thiểu hóa mức dao động bên trong một subgroup. Điều này giúp bạn “nhìn ra” độ dao động của các giá trị trung bình dễ dàng hơn.
  • Chọn tần suất thu thập dữ liệu. Thời gian luôn là yếu tố quan trọng để giải thích dữ liệu. Dữ liệu nên được thu thập theo thứ tự với thời gian chúng được tạo ra.
  • Chọn số lượng subgroup cần thiết trước khi đi vào tính các control limit. Bạn có thể bắt đầu biểu đồ kiểm soát với 5 subgroup. Bạn cần phải tính lại giá trị trung bình và các control limit khi các subgroup mới được thêm vào cho đến khi bạn có ít nhất 20 subgroup.
  • Trong mỗi subgroup, tính giá trị trung bình \bar{X} của subgroup với X_{1}, X_{2}, etc là giá trị của từng dữ liệu riêng rẽ và n là kích thước dữ liệu của subgroup.

\bar{X} = \frac{\sum X_{i}}{n} = \frac{X_{1}+X_{1}+...+X_{n}}{n}

  • Trong mỗi subgroup, tính độ lệch chuẩn của subgroup.

s = \sqrt{\frac{\sum (X_{i} - \bar{X})^{2}}{n-1}}

2. Biểu diễn dữ liệu trên biểu đồ

  • Chọn scale cho trục x và trục y cho cả hai biểu đồ \bar{X} s .
  • Biểu diễn độ lệch chuẩn \dpi{120} \large s của các subgroup lên biểu đồ s  và nối các điểm liên tiếp nhau bằng một đường thẳng.
  • Biểu diễn giá trị trung bình của các subgroup lên biểu đồ \bar{X}  và nối các điểm liên tiếp nhau bằng một đường thẳng.

3. Tính toán giá trị trung bình và các control limit của toàn bộ quy trình

  • Tính toán độ lệch chuẩn trung bình (\bar{s} ), với s_{1}, s_{2}, ... là độ lêch chuẩn của subgroup 1, subgroup 2, … và k là số lượng của các subgroup.

\bar{s} = \frac{\sum_{i=1}^{k}s_{i}}{k} = \frac{s_{1} + s_{2} + ... + s_{k}}{k}

  • Biểu diễn \bar{s} lên biểu đồ s
  • Tính toán giá trị trung bình của toàn bộ quy trình, với \bar{X}_{1}, \bar{X}_{2}, … là giá trị trung bình của subgroup 1, subgroup 2, …

\bar{\bar{X}} = \frac{X_{1} + X_{2} + ... + X_{k}}{k}

  • Biểu diễn giá trị trung bình của toàn bộ quy trình lên biểu đồ \bar{X}
  • Tính toán giá trị control limit của biểu đồ s với các hằng số B_{3}B_{4} của biểu đồ kiểm soát.

Upper control limit = UCL_{s}B_{4}\cdot \bar{s}

Lower control limit = LCL_{s} = B_{3}\cdot \bar{s}

  • Biểu diễn các đường control limit UCL_{s}LCL_{s} lên biểu đồ s.
  • Tính toán giá trị control limit cho biểu đồ \dpi{120} \large \bar{X} với các hằng số \dpi{120} \large A_{3} của biểu đồ kiểm soát.

Upper control limit = UCL_{s} = \bar{\bar{X}} + A_{3}\cdot \bar{s}

Lower control limit = LCL_{s} = \bar{\bar{X}} - A_{3}\cdot \bar{s}

  • Biểu diễn các đường control limit UCL_{s}LCL_{s} lên biểu đồ \bar{X}.

4. Diễn giải dữ liệu

Bạn nên xem xét độ dao động đầu tiên. Nếu biểu đồ s bị out of control (mình tạm dịch là mất kiểm soát) thì biểu đồ \bar{X} mất giá trị bởi vì bạn đã không có được một giá trị ước lượng chuẩn xác của \bar{s}.

5. Tính độ lệch chuẩn của quy trình nếu phù hợp.

Nếu biểu đồ s nằm trong statistical control, độ lệch chuẩn của toàn bộ quy trình có thể được tính như sau:

\sigma' = \bar{s}/C_{4}

Giá trị C_{4} phụ thuộc vào kích thước dữ liệu của subgroup.

Nếu các biểu đồ kiểm soát thể hiện được rằng quy trình thì nằm trong statiscal control, sử dụng các control limit này trong tương lai và dùng chúng để giám sát hoạt động của quy trình. Nếu biểu đồ kiểm soát thể hiện một dao động gây ra bởi một nguyên nhân đặc biệt, tìm ra nguyên nhân đặc biệt đó và loại bỏ nó khỏi quy trình. Nếu bạn có đủ 20 data points nằm trong statistical control, hãy tính lại control limit dựa trên các data points này, và sử dụng giá trị control limit mới tính được để giám sát quy trình trong tương lai.

Chia sẻ bài viết

5 thoughts on “Xbar-s Control Charts”

  1. Em chào a
    Bài viết của anh rất hay, rõ ràng và dễ hình dung. Hiện tại em đang có một bài toán khá khó khăn chưa giải quyết được. Em mong anh có thể giúp đỡ em. Bài toán em đang gặp phải như sau:
    Em khảo sát va đập của ống, 1 mẫu em có 20 ống thử va đập. Cách thử: ống 1 thử ở độ cao H vd: H=0.5m ống 1 vỡ thì giảm độ cao xuống 0.1m và thử ống 2 ở độ cao H = 0.4m, nếu ống 1 không vỡ thì thử ống 2 ở độ cao tăng lên 0.1m H = 0.6. Làm tương tự như vậy với các ống tiếp theo. Sau khi đủ kết quả H của 20 ống em sẽ tính ra chiều cao Htb (chiều cao mà tại đó 50% ống vỡ và 50% ống ko vỡ). Em khảo sát trong khoảng 6 ca tương đương 2 ngày (mỗi ca em lấy 20 ống để thử). Nhưng em phân vân không biết khi tính theo công thức LCL theo như bài viết của anh thì đó có phải là chiều cao nhỏ nhất mà ống có thể chịu được va đập hay không. Và từ Htb làm thế nào em có thể đánh giá được biến động trong công nghệ, nguyên liệu hay thiết bị vì có hôm em lấy 3 ca liên nhau nhưng kết quả ca 1,2 gần giống nhau nhưng ca 3 kết quả Htb lại tăng đột biệt mặc dù cùng nguyên liệu, cùng máy và thông số công nghệ.
    Hi vọng anh có thể cho em xin lời khuyên ạ.
    Em cảm ơn anh nhiều

  2. Hi Nam,
    Cảm ơn em đã gửi câu hỏi.
    Anh đã đọc qua bài toán của em nhưng anh nghĩ bài viết này không áp dụng cho bài toán của em được. Trước khi comment về vấn đề của em, anh sẽ giải thích 2 khái niệm trong biểu đồ kiểm soát là Specs limit và Control limit.

    Giả sử công ty anh sản xuất đầu bút bi. Có một khách hàng đặt hàng sản xuất với yêu cầu là đường kính đầu bút bi KHÔNG ĐƯỢC nằm ngoài khoảng (4mm, 6mm). Trong trường hợp này thì 4mm là Lower Specs Limit (LSL) và 6mm là Upper Specs Limit (USL). Tất cả các đầu bút bi được sản xuất ra mà nằm ngoài khoảng (LSL, USL) này đều bị SCRAP (huỷ) vì không đạt yêu cầu khách hàng.

    Công ty anh có 1 máy gia công để sản xuất đầu bút bi. Giả sử anh cho chạy 1000 mẫu và áp dụng công thức ở bài trên để tính thì anh có được khoảng control limit là (4.5mm, 5.5mm). Như vậy Lower Control Limit (LCL) là 4.5mm và Upper Control Limit (UCL) là 5.5mm. Vậy nếu 1 sản phẩm A có đường kính là 4.2mm thì điều gì sẽ xảy ra? Sản phẩm A đã bị Out of Control (OOC) Limit vì giá trị nhỏ hơn LCL, nhưng sản phẩm A vẫn nằm trong Specs Limit vì lớn hơn LSL. Trong trường hợp này thì anh không bắt buộc phải SCRAP sản phẩm A ( vì vẫn nằm trong khoảng yêu cầu của khách hàng) nhưng việc sản phẩm A bị OOC chứng tỏ quy trình sản xuất đầu bút bi tại thời điểm đó là không bình thường – cái có thể có rất nhiều lý do gây ra (người vận hành thao tác sai, vật liệu thô bị hỏng, ….) và nếu anh là một process engineer thì anh có nhiệm vụ phải đi tìm nguyên nhân chính xác vì sao sản phẩm A bị OOC.

    Quay trở lại với bài toán của em. Theo anh hiểu thì sản phẩm của em là ỐNG, và yêu cầu của khách hàng là KHÔNG ĐƯỢC VỠ ( tất cả các ống vỡ đều được tính là sản phẩm hỏng). Vậy thì giá trị độ cao H khiến ống bị vỡ tìm chính là Upper Specs Limit của độ cao, độ cao va đập tối đa cho mỗi ống đều không được lớn hơn giá trị USL này. Và không giống với giá trị khối lượng bao cát trong bài viết của anh, giá trị độ cao va đập của em không có LCL. Giá trị độ cao va đập trong bài toán của em chỉ có một đại lượng duy nhất em cần phải tìm là USL – là độ cao va đập tối đa mà ống có thể chịu được.

    Còn ý thứ 2 là biến động. Quy trình nào cũng có biến động cả, ví dụ trong quy trình đóng bao bì thì cân nặng của bao không bao giờ chính xác là 50kg cả mà là 50.3, 50.1, 49.8, 49.7… Cái cần xác định là liệu biến động đó là biến động BÌNH THƯỜNG hay biến động BẤT THƯỜNG. Đó là lý do của việc xây dựng control limit. Khi một giá trị nằm ngoài control limit thì đó là biến động bất thường. Trong trường hợp này em có thể dùng một số phương pháp như 5M +E, SIPOC để mapping input – output của process và từ đó tìm ra yếu tố nào tạo ra giá trị bất thường đó.

    Hy vọng câu trả lời giúp ích được cho em. Thank you.

    1. Hi anh!
      Hiện tại, em cũng đang là 1 FSer. Em đang tìm tài liệu thì vô tình đọc được bài viết của anh rất rõ ràng và dễ hiểu thêm vào đó là sự nhiệt tình.
      Cám ơn anh nhiều nhé.
      Chúc anh sức khỏe trong mùa dịch 🙂

Leave a Comment

Your email address will not be published. Required fields are marked *

Scroll to Top