ويسترن ديجيتال تكشف عن دورة البيانات في الذكاء الاصطناعي ودور التخزين فيها
قال بيتر هايلز، مدير تسويق المنتجات (HDD) في Western Digital، إنه مع استمرار صناعة الذكاء الاصطناعي (AI) في بناء بنية تحتية جديدة لتدريب الذكاء الاصطناعي وتقديم خدمات جديدة، هناك آثار مهمة على كيفية تخزين هذه البيانات.بينما يقوم الذكاء الاصطناعي بإنشاء بيانات جديدة وزيادة قيمة البيانات الموجودة، يظهر نمط دوري بسرعة، مما يزيد من متطلبات التخزين ويحفز توليد المزيد من البيانات. يؤدي هذا إلى إنشاء ما يسمى بـ “دورة بيانات فضيلة الذكاء الاصطناعي”. يعد فهم هذه الدورة أمرًا مهمًا للشركات التي تتطلع إلى الاستفادة من قدرات الذكاء الاصطناعي.دورة بيانات الذكاء الاصطناعي المكونة من ست مراحلتتكون دورة بيانات الذكاء الاصطناعي من إطار من ست مراحل. تركز المرحلة الأولى على جمع وتخزين البيانات الأولية. يتم جمع البيانات وتخزينها من مصادر متعددة. يعد تحليل جودة البيانات المجمعة وتنوعها أمرًا بالغ الأهمية لأنه يشكل الأساس للمراحل التالية. في هذه المرحلة، يوصى باستخدام محركات الأقراص الثابتة عالية السعة (eHDDs) لأنها توفر أعلى سعة لكل قرص وأقل تكلفة لكل بت.والخطوة الثانية هي إعداد البيانات للاستخدام. في هذه المرحلة، تتم معالجة بيانات التدريب وتنظيفها وتحويلها. لدعم هذه المرحلة، تستفيد مراكز البيانات من بنيات التخزين المتطورة مثل بحيرات البيانات السريعة لدعم البيانات الجاهزة للاستخدام. هذا هو المكان الذي تكون فيه هناك حاجة إلى محركات أقراص SSD عالية السعة لتوسيع مساحة تخزين محرك الأقراص الثابتة الحالية أو إنشاء أنظمة تخزين جديدة تعتمد بالكامل على محركات الأقراص الثابتة المحمولة.ثم تأتي مرحلة تدريب نماذج الذكاء الاصطناعي لعمل تنبؤات دقيقة باستخدام بيانات التدريب. يتم هذا التدريب على أجهزة الكمبيوتر العملاقة عالية الأداء والتي تتطلب تخزينًا خاصًا عالي الأداء. تم تصميم محركات أقراص التخزين المحمولة عالية المدى (eSSDs) وفقًا للاحتياجات المحددة لهذه المرحلة.تتعلق الخطوة التالية بالتفاعل مع نماذج الذكاء الاصطناعي، وإنشاء واجهة سهلة الاستخدام للنماذج. تتضمن هذه المرحلة تطوير واجهات برمجة التطبيقات (APIs) واللوحات والأدوات التي تجمع البيانات وسياقها مع تعليمات للمستخدم النهائي. يتم بعد ذلك دمج نماذج الذكاء الاصطناعي في تطبيقات الإنترنت والعملاء دون الحاجة إلى استبدال الأنظمة الحالية، مما يعني أن الحفاظ على الأنظمة الحالية يتطلب مساحة تخزين إضافية إلى جانب حوسبة الذكاء الاصطناعي الجديدة. في هذه المرحلة، هناك حاجة إلى محركات أقراص SSD أكبر وأسرع لترقيات الذكاء الاصطناعي في أجهزة الكمبيوتر وأجهزة الفلاش المدمجة عالية السعة للهواتف الذكية وأنظمة إنترنت الأشياء.ثم تأتي مرحلة بدء تشغيل محرك التنبؤ، حيث يتم نشر النماذج المدربة في بيئات الإنتاج لتحليل البيانات الجديدة وإنشاء محتوى جديد أو تقديم تنبؤات في الوقت الفعلي. تعد كفاءة المحرك أمرًا بالغ الأهمية لاستجابات الذكاء الاصطناعي السريعة والدقيقة. مطلوب أداء تخزين قوي لضمان تحليل شامل للبيانات. يمكن استخدام محركات أقراص SSD عالية السعة لدفق البيانات أو تصميمها في خوادم التنبؤ بناءً على الحجم المطلوب أو وقت الاستجابة. يمكن أيضًا استخدام محركات أقراص SSD عالية الأداء للتخزين المؤقت.وأخيرًا، يتم إنشاء محتوى جديد وتخزينه باستخدام رؤى من نماذج الذكاء الاصطناعي. تؤثر هذه المرحلة مرة أخرى على الدورة وتدفع إلى التحسين المستمر من خلال زيادة قيمة البيانات لاستخدامها في التدريب أو للتحليل بواسطة النماذج المستقبلية. يتم تخزين المحتوى المنتج على محركات الأقراص الثابتة المؤرشفة في مراكز البيانات بالإضافة إلى محركات أقراص SSD عالية السعة وأجهزة الفلاش المدمجة للأجهزة الطرفية التي تعمل بالذكاء الاصطناعي.دورة توليد البيانات ذاتية الاستدامةمن خلال فهم هذه المراحل الست من دورة بيانات الذكاء الاصطناعي وامتلاك الأدوات المناسبة، يمكن للشركات تحسين استدامة التكنولوجيا لأداء الوظائف الداخلية وتحقيق فوائد الذكاء الاصطناعي.اليوم، يستخدم الذكاء الاصطناعي البيانات لإنتاج النصوص ومقاطع الفيديو والصور والمحتويات الأخرى المثيرة للاهتمام. يعمل هذا النمط المستمر من استهلاك البيانات وتوليدها على تسريع الحاجة إلى تقنيات تخزين قابلة للتطوير وقائمة على الأداء لإدارة كميات كبيرة من البيانات بشكل فعال وإعادة هيكلة البيانات المعقدة، مما يؤدي إلى الابتكار.نظرًا لأن التخزين يلعب دورًا متزايد الأهمية في هذا المجال، فإن القدرة على الوصول إلى البيانات وكفاءة ودقة نماذج الذكاء الاصطناعي ومجموعات البيانات الأكبر والأعلى جودة ستصبح ذات أهمية متزايدة. بالإضافة إلى ذلك، مع انتشار الذكاء الاصطناعي عبر الصناعات، يمكن للشركاء والعملاء أن يتوقعوا من موفري مكونات التخزين تكييف منتجاتهم مع كل مرحلة من مراحل دورة بيانات الذكاء الاصطناعي.