Dữ Liệu Lỗi Tổng Hợp Cho Sản Xuất HVMM: Cách Thị Giác AI Phá Vỡ Nút Thắt Dữ Liệu

Trong ba mươi năm, bước hạn chế tốc độ trong việc triển khai thị giác AI vào sản xuất khối lượng lớn, đa dạng vừa không phải là mô hình. Đó là dữ liệu. Các mô hình thị giác công nghiệp cần 500 đến 2.000 hình ảnh được gán nhãn cho mỗi loại lỗi để huấn luyện đáng tin cậy, và lỗi theo định nghĩa là hiếm. Nhân với 10 đến 15 biến thể điển hình trên một dây chuyền HVMM và phép toán nhanh chóng trở nên xấu xí: 1 đến 4 năm thu thập tự nhiên để phủ đầy đủ một đội mô hình.
Nút thắt đó đã bị phá vỡ. Tạo lỗi tổng hợp tạo ra cùng dữ liệu huấn luyện được gán nhãn trong vài phút mà thu thập tự nhiên tạo ra trong vài tháng. Bài viết này giải thích cơ chế, hình thức triển khai mà nó cho phép và lý do tại sao nó quan trọng cụ thể đối với mô hình khối lượng lớn, đa dạng vừa thống trị sản xuất thực.
Để có phân tích kỹ thuật đầy đủ với trích dẫn nghiên cứu ngành và kiến trúc tham chiếu hoàn chỉnh, xem whitepaper về dữ liệu tổng hợp trong sản xuất HVMM.
Nút thắt dữ liệu, bằng các con số cụ thể
Một dây chuyền sản xuất một lỗi mỗi nghìn chi tiết ở 50.000 chi tiết mỗi ngày tạo ra khoảng 50 ứng viên lỗi hằng ngày. Để thu thập 500 ví dụ được gán nhãn của một loại lỗi trên một biến thể mất khoảng 10 ngày sản xuất liên tục. Đối với một loại hiếm xảy ra ở mức 1 trên 50.000 chi tiết (ví dụ: hạt lạ trong điền đầy dược phẩm, nhô lá trên cell pin lithium dạng túi, vi nứt trong wafer mặt trời), cùng việc thu thập đó mất 500 ngày, khoảng 16 tháng sản xuất một ca.
Bây giờ nhân với 12 biến thể và 6 loại lỗi cho mỗi biến thể. Tổng thời gian thu thập tự nhiên cho một đội mô hình HVMM được phủ đầy đủ chạy giữa 1 và 4 năm. Hầu hết các nhà sản xuất không có nhiều năm để chờ đợi và các dây chuyền HVMM không đứng yên trong khi việc thu thập diễn ra. Một dây chuyền điển hình giới thiệu 3 đến 7 SKU mới mỗi năm, ngừng các SKU khác và hấp thụ các thay đổi vật liệu do nhà cung cấp thúc đẩy. Đội biến thể đang chuyển động. Thu thập dữ liệu lỗi tự nhiên không thể bắt kịp vì dây chuyền cứ thay đổi dưới chân nó.
Cách tạo tổng hợp thực sự hoạt động

Dữ liệu lỗi tổng hợp, trong ngữ cảnh kiểm tra sản xuất, có nghĩa là hình ảnh huấn luyện được tạo theo chương trình trông giống như hình ảnh sản xuất thực. Hình ảnh cơ sở là thực: một bức ảnh độ phân giải cao của sản phẩm thực của nhà sản xuất, được chụp bởi camera sản xuất, dưới ánh sáng thực của dây chuyền. Lỗi được kết xuất lên trên. Sự kết hợp là một ví dụ huấn luyện đã được gán nhãn.
Đây là một đề xuất khác với câu chuyện dữ liệu tổng hợp trong xe tự hành hoặc robot, nơi thử thách là mô phỏng toàn bộ thế giới trực quan. Trong kiểm tra sản xuất, hệ thống làm việc từ một hình ảnh được giới hạn chặt chẽ, trong phân phối của sản phẩm thực. Việc tổng hợp được nhắm mục tiêu: đặt một mảnh vỡ trên cạnh này, một vết xước trên bề mặt kia, một chân cong ở vị trí đó, một mảnh hạt trên hốc điền đầy đó. Photoshop trên đường ray, được chạy bởi một kỹ sư chất lượng.
Mỗi hình ảnh tổng hợp được tạo trong dưới 30 giây. Ba tác vụ tạo chạy song song. Đối với hầu hết các loại lỗi, 20 đầu vào hình ảnh thực là đủ để khởi tạo hệ thống; mô hình thị giác cơ bản được thiết kế cho hiệu quả mẫu, với việc tạo tổng hợp mở rộng phân phối. Có thể sử dụng nhiều hơn khi cần. Số lượng mẫu không còn là ràng buộc.
Vì sao các mô hình không "đi lệch hướng" trên dữ liệu tổng hợp
Mối lo ngại hợp lý về dữ liệu huấn luyện tổng hợp là liệu mô hình có học cách phát hiện các tạo tác trông giống được kết xuất thay vì lỗi thực hay không, và thất bại trong sản xuất. Câu trả lời được thiết kế vào trong quy trình thay vì giả định.
Bề mặt sản phẩm thực, camera thực, lỗi được kết xuất. Các mẫu tổng hợp không phải là hình ảnh stock chung. Mỗi mẫu được xây dựng trên hình ảnh thực của sản phẩm thực của nhà sản xuất, được chụp bởi camera sản xuất thực, dưới biên dạng chiếu sáng thực của dây chuyền. Lỗi được kết xuất lên trên. Mô hình huấn luyện trên bề mặt sản phẩm thực cộng với lỗi thực tế, không phải trên các tạo tác hoạt hình.
Độ phân giải pixel-tới-pixel được bảo toàn từ đầu đến cuối. Công cụ tạo tổng hợp khớp với độ phân giải gốc của camera. Không có việc nâng độ phân giải, giảm mẫu hoặc tạo tác nén giữa việc tạo và triển khai.
Xuất và nhập trực tiếp camera. Các mô hình huấn luyện trên các mẫu tổng hợp ở chính xác độ phân giải và không gian màu mà chúng sẽ thấy trong sản xuất, sau đó triển khai trực tiếp đến camera thông minh. Không có chuyển đổi định dạng. Không có khoảng cách miền giữa huấn luyện và suy luận.
Đầu ra do kỹ sư phụ trách. Mỗi mẫu được tạo được xem xét trước khi huấn luyện. Các bản tạo yếu hoặc ngoài phân phối bị loại bỏ. Tập huấn luyện mà mô hình thấy là tập con đã được phụ trách, không phải đầu ra thô.
Style Transfer: bộ nhân đội biến thể
Tính năng quan trọng nhất bên trong lớp dữ liệu tổng hợp là cái mà chúng tôi gọi là Style Transfer. Tạo một loại lỗi một lần trên hình ảnh tốt đã biết của Biến Thể A. Style Transfer lấy lỗi đã được tạo đó và kết xuất nó lên hình ảnh sạch của Biến Thể B, trong màu, vật liệu, mạ, dệt và lớp hoàn thiện bề mặt thực của Biến Thể B. Vật lý lỗi (hình dạng, tỷ lệ, dải mức độ nghiêm trọng, phân phối vị trí) chuyển sang. Ngữ cảnh trực quan được xây dựng lại.
Cùng một lượt mở rộng đến Biến Thể C, D, E, qua phần còn lại của họ biến thể. Màu khác nhau. Vật liệu khác nhau. Hình học khác nhau. Thư viện lỗi mất một buổi chiều để tạo trên Biến Thể A trở thành thư viện lỗi phủ toàn bộ đội biến thể, bao gồm các biến thể mà dây chuyền chưa sản xuất một đơn vị nào.
Hiệu ứng thực tế là thư viện lỗi mở rộng dưới tuyến tính theo số lượng biến thể. Một đội 15 biến thể không yêu cầu nỗ lực tạo gấp 15 lần đội 1 biến thể. Nó yêu cầu khoảng 1,05 lần nỗ lực. Trên các triển khai khách hàng, một loại lỗi đã được tạo đạt trung bình 14 biến thể trước khi cần tinh chỉnh lại.
Khung mà điều này cho phép là khác thường: mô hình được huấn luyện trên các biến thể mà dây chuyền chưa từng sản xuất. Khi một SKU mới cuối cùng chạy dây chuyền lần đầu tiên, mô hình kiểm tra đã biết các vết xước, mảnh vỡ, linh kiện thiếu và phần còn lại của thư viện lỗi trông như thế nào trên nó. Không có giai đoạn học tập sau khi ra mắt SKU.
Hình thức triển khai mà điều này cho phép
Khi bước dữ liệu theo từng biến thể không còn hạn chế tốc độ, các triển khai HVMM phù hợp với bốn tuần thay vì bốn quý.
- Tuần 1 (thí điểm). Lắp camera. Chụp 5 đến 20 hình ảnh thực của biến thể có khối lượng cao nhất. Tạo phân phối lỗi tổng hợp cho các loại lỗi ưu tiên (20 đến 30 phút). Huấn luyện, triển khai, xác thực với mẫu tốt và lỗi đã biết. Tổng công việc: ~4 giờ nỗ lực tập trung trong tuần.
- Tuần 2 đến 3 (mở rộng). Thêm một công thức cho mỗi biến thể. Mỗi biến thể cần 5 đến 20 hình ảnh thực cộng với một lượt Style Transfer (khoảng 6 phút mỗi biến thể) cộng với một lượt huấn luyện (38 đến 54 phút). Mỗi biến thể hoàn thành trong dưới 90 phút thời gian thực.
- Tuần 4 (tích hợp). Kết nối với PLC qua EtherNet/IP, PROFINET hoặc Modbus. Tự động hóa chuyển đổi công thức. Cấu hình đầu ra đạt/không đạt cho cơ chế loại bỏ. Chuyển đổi dây chuyền.
- Liên tục (cải thiện). Sử dụng Haystack để đưa ra các trường hợp biên khi sản xuất trôi đi. Huấn luyện lại các mô hình biến thể riêng lẻ trong vài phút khi các chế độ lỗi mới xuất hiện.
Hình thức bốn tuần này so với cơ sở lịch sử 11 đến 24 tháng cho một triển khai HVMM có phạm vi tương đương. Sự nén lại khoảng một bậc về thời gian lịch trên toàn bộ đội biến thể.
Các giới hạn đáng nói thẳng thắn
Dữ liệu tổng hợp không phải là dung môi vạn năng. Bốn giới hạn đáng được nêu tên:
Nó không thay thế sự đa dạng hình ảnh cơ sở. Nếu các hình ảnh chi tiết tốt được chụp không bao quát biến thể sản xuất hợp pháp (trôi chiếu sáng, trôi màu nhà cung cấp, biến thể lớp hoàn thiện bề mặt qua các lô), các mẫu tổng hợp sẽ thừa hưởng những khoảng trống đó. Biện pháp giảm thiểu không hấp dẫn nhưng bắt buộc: chụp hình ảnh chi tiết tốt bao quát phạm vi sản xuất thực, bao gồm cả các cạnh.
Nó không sáng tạo vật lý lỗi mà nó chưa được cho thấy. Các chế độ lỗi thực sự mới chưa từng được nhìn thấy ở bất cứ đâu không được dự đoán bởi quy trình tổng hợp. Chúng được đưa ra bởi lớp học liên tục (Haystack), không phải bởi việc tạo tổng hợp.
Style Transfer có giới hạn độ trung thực trên các chuyển tiếp vật liệu cực đoan. Một loại lỗi được tạo trên vải mờ và chuyển sang kim loại đánh bóng sẽ yêu cầu xác thực. Trong thực tế, các đội biến thể thúc đẩy HVMM thường nằm trong cùng họ, nhưng giới hạn là có thật.
Các môi trường được quản lý vẫn yêu cầu xác thực dữ liệu thực. Các ứng dụng thiết bị y tế FDA, dược phẩm, an toàn nguy cơ ô tô và hàng không vũ trụ thường yêu cầu chứng minh hiệu suất mô hình so với mẫu sản xuất thực bất kể dữ liệu huấn luyện được tạo như thế nào. Dữ liệu tổng hợp đẩy nhanh con đường đến mô hình được xác thực; nó không loại bỏ bước xác thực.
Nút thắt chuyển đến đâu tiếp theo
Trong ba mươi năm, bước hạn chế tốc độ trong thị giác công nghiệp là dữ liệu được gán nhãn theo từng biến thể. Với việc tạo tổng hợp, bước đó giờ đây mất vài phút. Nút thắt tiếp theo trên chuỗi là tốc độ phân phối sản xuất trôi đi và tốc độ hệ thống kiểm tra hấp thụ trôi đó. Quản lý trôi có thể quan sát, đo lường và cải thiện. Thu thập dữ liệu ở cấp biến thể không có những điều đó. Mong đợi mười tám tháng phát triển khả năng tiếp theo trong phân khúc này tập trung vào lớp học liên tục: phát hiện trôi nhanh hơn, đưa ra trường hợp biên tốt hơn, các vòng huấn luyện lại tự động hơn.
Để có phân tích kỹ thuật đầy đủ với trích dẫn nghiên cứu ngành, kinh tế triển khai và kiến trúc tham chiếu, xem whitepaper về dữ liệu tổng hợp trong sản xuất HVMM. Để có ngữ cảnh mô hình HVMM rộng hơn, xem cách kiểm tra AI thích ứng với các biến thể sản phẩm của bạn.
Muốn có phân tích kỹ thuật đầy đủ?
Whitepaper HVMM bao quát phép toán dữ liệu, tài liệu bổ sung GAN, các nghiên cứu điển hình của BMW và Siemens, kiến trúc tham chiếu bốn lớp, kinh tế triển khai và các giới hạn thẳng thắn một cách chi tiết.
Tải Whitepaper