توافق دوال DP4a المضمّنة مع WGSL
تشير DP4a (المنتج النقطي لأربعة عناصر والتراكم) إلى مجموعة من تعليمات وحدة معالجة الرسومات (GPU) الشائعة الاستخدام في استنتاج التعليم العميق للتكميم. تُجري هذه الوحدة ضربًا نقطيًا للأعداد الصحيحة ذات 8 بتات بكفاءة لتسريع عملية الحوسبة لهذه النماذج الكمية ذات 8 بتات. يمكن أن توفّر (ما يصل إلى 75%) من سعة الذاكرة ونطاق ترددي الشبكة، كما يمكن أن تحسّن أداء أي نماذج لتعلُّم الآلة في الاستدلال مقارنةً بإصدار f32. ونتيجةً لذلك، يتم استخدامه الآن بشكل كبير في العديد من أُطر الذكاء الاصطناعي الشائعة.
عندما تكون "packed_4x8_integer_dot_product" إضافة لغة WGSL متوفّرة في navigator.gpu.wgslLanguageFeatures، يمكنك الآن استخدام أعداد صحيحة قياسية 32 بت لتعبئة متّجهات ذات 4 مكوّنات من أعداد صحيحة 8 بت كمدخلات لتعليمات الضرب النقطي في رمز برنامج التظليل WGSL باستخدام الدالتَين المضمّنتَين dot4U8Packed وdot4I8Packed. يمكنك أيضًا استخدام تعليمات التعبئة والتفريغ مع متجهات مكوّنة من 4 عناصر من أعداد صحيحة ذات 8 بتات مع دوال WGSL المضمّنة pack4xI8 وpack4xU8 وpack4xI8Clamp وpack4xU8Clamp وunpack4xI8 وunpack4xU8.
يُنصح باستخدام requires-directive للإشارة إلى إمكانية عدم التوافق مع requires packed_4x8_integer_dot_product; في أعلى رمز تظليل WGSL. راجِع المثال التالي والمشكلة tint:1497.
if (!navigator.gpu.wgslLanguageFeatures.has("packed_4x8_integer_dot_product")) {
throw new Error(`DP4a built-in functions are not available`);
}
const adapter = await navigator.gpu.requestAdapter();
const device = await adapter.requestDevice();
const shaderModule = device.createShaderModule({ code: `
requires packed_4x8_integer_dot_product;
fn main() {
const result: u32 = dot4U8Packed(0x01020304u, 0x02040405u); // 42
}`,
});
نشكر بشكل خاص فريق Web Graphics في شركة Intel في شنغهاي على إكمال هذه المواصفات وعملية التنفيذ.
مَعلمات المؤشر غير المقيدة في WGSL
يؤدي "unrestricted_pointer_parameters" امتداد لغة WGSL إلى تخفيف القيود المفروضة على المؤشرات التي يمكن تمريرها إلى دوال WGSL:
تشير مؤشرات المَعلمات الخاصة بمساحات العناوين
storageوuniformوworkgroupإلى الدوال التي يحدّدها المستخدم.تمرير مؤشرات إلى عناصر البنية وعناصر المصفوفة إلى الدوال التي يحدّدها المستخدم
يمكنك الاطّلاع على المؤشرات كمعلّمات دالة | جولة في WGSL لمعرفة المزيد عن ذلك.
يمكن رصد توفّر هذه الميزة باستخدام navigator.gpu.wgslLanguageFeatures. يُنصح دائمًا باستخدام requires-directive للإشارة إلى إمكانية عدم التوافق مع requires unrestricted_pointer_parameters; في أعلى رمز تظليل WGSL. راجِع المثال التالي وتغييرات مواصفات WGSL والمشكلة tint:2053.
if (!navigator.gpu.wgslLanguageFeatures.has("unrestricted_pointer_parameters")) {
throw new Error(`Unrestricted pointer parameters are not available`);
}
const adapter = await navigator.gpu.requestAdapter();
const device = await adapter.requestDevice();
const shaderModule = device.createShaderModule({ code: `
requires unrestricted_pointer_parameters;
@group(0) @binding(0) var<storage, read_write> S : i32;
fn func(pointer : ptr<storage, i32, read_write>) {
*pointer = 42;
}
@compute @workgroup_size(1)
fn main() {
func(&S);
}`
});
بنية مختصرة لإلغاء الإشارة إلى المركّبات في WGSL
عندما يكون "pointer_composite_access" امتداد لغة WGSL متوفّرًا في navigator.gpu.wgslLanguageFeatures، يتيح رمز التظليل WGSL الآن الوصول إلى مكوّنات أنواع البيانات المعقّدة باستخدام بناء الجملة نفسه (.)، سواء كنت تعمل مباشرةً مع البيانات أو مع مؤشر إليها. وإليك كيفية تنفيذ ذلك:
إذا كان
fooمؤشرًا، فإنّfoo.barهي طريقة أكثر ملاءمة لكتابة(*foo).bar. عادةً ما تكون العلامة النجمية (*) مطلوبة لتحويل المؤشر إلى "مرجع" يمكن إلغاء الإشارة إليه، ولكن الآن أصبح كل من المؤشرات والمراجع متشابهَين إلى حد كبير ويمكن استخدامهما بالتبادل تقريبًا.إذا لم يكن
fooمؤشرًا: يعمل عامل التشغيل النقطي (.) تمامًا كما اعتدت عليه للوصول إلى الأعضاء مباشرةً.
وبالمثل، إذا كان pa مؤشرًا يخزّن عنوان البداية لمصفوفة، فإنّ استخدام pa[i] يتيح لك الوصول مباشرةً إلى موقع الذاكرة الذي يتم فيه تخزين العنصر رقم 'i من هذه المصفوفة.
يُنصح باستخدام requires-directive للإشارة إلى إمكانية عدم التوافق مع requires pointer_composite_access; في أعلى رمز تظليل WGSL. اطّلِع على المثال التالي وissue tint:2113.
if (!navigator.gpu.wgslLanguageFeatures.has("pointer_composite_access")) {
throw new Error(`Pointer composite access is not available`);
}
const adapter = await navigator.gpu.requestAdapter();
const device = await adapter.requestDevice();
const shaderModule = device.createShaderModule({ code: `
requires pointer_composite_access;
fn main() {
var a = vec3f();
let p : ptr<function, vec3f> = &a;
let r1 = (*p).x; // always valid.
let r2 = p.x; // requires pointer composite access.
}`
});
حالة منفصلة للقراءة فقط لكلّ من جوانب الاستنسل والعمق
في السابق، كانت المرفقات ذات العمق والستنسل للقراءة فقط في عمليات العرض تتطلّب أن يكون كلا الجانبين (العمق والستنسل) للقراءة فقط. تمت إزالة هذا القيد. يمكنك الآن استخدام ميزة "العمق" في وضع القراءة فقط، لتتبُّع ظل التلامس مثلاً، بينما تتم كتابة مخزن مؤقت للاستنسل لتحديد وحدات البكسل من أجل إجراء المزيد من المعالجة. اطّلِع على المشكلة dawn:2146.
إشعارات الفجر
يتم الآن استدعاء دالة معاودة الاتصال الخاصة بالخطأ غير الملتقط التي تم ضبطها باستخدام wgpuDeviceSetUncapturedErrorCallback() على الفور عند حدوث الخطأ. وهذا ما يتوقّعه المطوّرون ويريدونه باستمرار لتصحيح الأخطاء. راجِع تغيير الفجر:173620.
تم تنفيذ الطريقة wgpuSurfaceGetPreferredFormat() من واجهة برمجة التطبيقات webgpu.h. راجِع المشكلة dawn:1362.
هذا يشمل بعض النقاط الرئيسية فقط. اطّلِع على قائمة عمليات الدمج الشاملة.
الميزات الجديدة في WebGPU
قائمة بكل ما تم تناوله في سلسلة الميزات الجديدة في WebGPU
Chrome 143
Chrome 142
Chrome 141
- اكتملت عملية تلوين الصورة بالأشعة تحت الحمراء
- تحليل نطاق الأعداد الصحيحة في برنامج تجميع WGSL
- تحديث SPIR-V 1.4 لخادم Vulkan الخلفي
- آخر الأخبار في Dawn
Chrome 140
- طلبات الأجهزة تستهلك المحوّل
- اختصار لاستخدام الزخرفة حيث يتم استخدام عرض الزخرفة
- تتيح الدالة WGSL textureSampleLevel استخدام زخارف أحادية الأبعاد
- إيقاف استخدام نسيج التخزين bgra8unorm للقراءة فقط
- إزالة سمة isFallbackAdapter في GPUAdapter
- آخر الأخبار في Dawn
Chrome 139
- إتاحة بنية ثلاثية الأبعاد لتنسيقات BC وASTC المضغوطة
- ميزة "الميزات الأساسية والحدود" الجديدة
- تجربة الميزة الأصلية لوضع التوافق مع WebGPU
- آخر الأخبار في Dawn
Chrome 138
- اختصار لاستخدام المخزن المؤقت كمورد ربط
- تغييرات في متطلبات الحجم للمخازن المؤقتة التي يتم ربطها عند الإنشاء
- تقرير البنية لوحدات معالجة الرسومات الحديثة
- إيقاف سمة isFallbackAdapter في GPUAdapter نهائيًا
- آخر الأخبار في Dawn
Chrome 137
- استخدام طريقة عرض الزخرفة لربط externalTexture
- نسخ المخازن المؤقتة بدون تحديد الإزاحات والحجم
- WGSL workgroupUniformLoad باستخدام مؤشر إلى عملية ذرية
- سمة powerPreference في GPUAdapterInfo
- إزالة سمة compatibilityMode في GPURequestAdapterOptions
- آخر الأخبار في Dawn
Chrome 136
- سمة isFallbackAdapter في GPUAdapterInfo
- تحسينات على وقت تجميع Shader على D3D12
- حفظ صور اللوحات ونسخها
- قيود وضع التوافق مع قياس التحسُّن
- آخر الأخبار في Dawn
Chrome 135
- السماح بإنشاء تخطيط مسار مع تخطيط مجموعة ربط فارغ
- السماح بتجاوز منافذ العرض لحدود عناصر العرض
- تسهيل الوصول إلى وضع التوافق التجريبي على Android
- إزالة الحدّ الأقصى لـ maxInterStageShaderComponents
- آخر الأخبار في Dawn
Chrome 134
- تحسين أحمال عمل تعلُّم الآلة باستخدام المجموعات الفرعية
- إزالة إمكانية فلترة أنواع المواد القابلة للطفو على أنّها قابلة للمزج
- آخر الأخبار في Dawn
Chrome 133
- تنسيقات إضافية للرؤوس unorm8x4-bgra و1-component
- السماح بطلب حدود غير معروفة بقيمة غير محدّدة
- تغييرات في قواعد المحاذاة في WGSL
- تحسينات أداء WGSL باستخدام discard
- استخدام VideoFrame displaySize للصور الخارجية
- التعامل مع الصور ذات الاتجاهات غير التلقائية باستخدام copyExternalImageToTexture
- تحسين تجربة المطوّرين
- تفعيل وضع التوافق باستخدام featureLevel
- إزالة ميزات المجموعات الفرعية التجريبية
- إيقاف حد maxInterStageShaderComponents نهائيًا
- آخر الأخبار في Dawn
Chrome 132
- استخدام TextureView
- دمج مواد العرض العائمة ذات 32 بت
- سمة adapterInfo في GPUDevice
- ضبط سياق لوحة العرض باستخدام تنسيق غير صالح يؤدي إلى ظهور خطأ في JavaScript
- قيود فلترة أداة أخذ العيّنات على المواد
- تجربة المجموعات الفرعية الموسّعة
- تحسين تجربة المطوّرين
- إتاحة تجريبية لتنسيقات البنية العادية ذات 16 بت
- آخر الأخبار في Dawn
Chrome 131
- مسافات القطع في WGSL
- GPUCanvasContext getConfiguration()
- يجب ألا تحتوي الأشكال الأساسية للنقاط والخطوط على انحياز العمق
- وظائف مدمجة للفحص الشامل للمجموعات الفرعية
- دعم تجريبي لعمليات الرسم غير المباشر المتعددة
- Shader module compilation option strict math
- إزالة طريقة requestAdapterInfo() في GPUAdapter
- آخر الأخبار في Dawn
Chrome 130
- دمج مصدرَين
- تحسينات على وقت تجميع Shader على Metal
- إيقاف طريقة requestAdapterInfo() في GPUAdapter نهائيًا
- آخر الأخبار في Dawn
Chrome 129
- التوافق مع النطاق العالي الديناميكية (HDR) في وضع "تحديد درجة اللون على اللوحة"
- توسيع نطاق دعم المجموعات الفرعية
- آخر الأخبار في Dawn
Chrome 128
- تجربة المجموعات الفرعية
- إيقاف ضبط انحياز العمق للخطوط والنقاط نهائيًا
- إخفاء تحذير "أدوات مطوّري البرامج" بشأن الخطأ غير الملتقط في حال استخدام preventDefault
- WGSL interpolate sampling first and either
- آخر الأخبار في Dawn
Chrome 127
- دعم تجريبي لـ OpenGL ES على Android
- سمة info في GPUAdapter
- تحسينات على إمكانية التشغيل التفاعلي في WebAssembly
- أخطاء محسّنة في ترميز الأوامر
- آخر الأخبار في Dawn
Chrome 126
- زيادة الحد الأقصى لعدد طبقات maxTextureArrayLayers
- تحسين تحميل المخزن المؤقت في الخلفية باستخدام Vulkan
- تحسينات على وقت تجميع Shader
- يجب أن تكون مخازن أوامر الإرسال فريدة
- آخر الأخبار في Dawn
Chrome 125
Chrome 124
- نسيجات مساحة التخزين للقراءة فقط والقراءة والكتابة
- توافق Service Workers وShared Workers
- سمات معلومات المحوّل الجديدة
- إصلاح الأخطاء
- آخر الأخبار في Dawn
Chrome 123
- إتاحة وظائف DP4a المضمّنة في WGSL
- معلَمات المؤشر غير المقيدة في WGSL
- بنية مختصرة لإلغاء الإشارة إلى العناصر المركّبة في WGSL
- حالة منفصلة للقراءة فقط لكل من الاستنسل وعمق الصورة
- آخر الأخبار في Dawn
Chrome 122
- توسيع مدى الوصول إلى الجمهور باستخدام "وضع التوافق" (ميزة قيد التطوير)
- زيادة الحد الأقصى لعدد سمات الرأس
- آخر الأخبار في Dawn
Chrome 121
- إتاحة WebGPU على Android
- استخدام DXC بدلاً من FXC لتجميع التظليل على Windows
- طلبات البحث عن الطوابع الزمنية في عمليات الحساب والعرض
- نقاط الدخول التلقائية إلى وحدات التظليل
- إتاحة مساحة ألوان display-p3 كـ GPUExternalTexture
- معلومات حِزم الذاكرة
- آخر الأخبار في Dawn
Chrome 120
- إتاحة قيم الفاصلة العائمة ذات 16 بت في WGSL
- تجاوز الحدود
- التغييرات على حالة العمق/الاستنسل
- تعديلات على معلومات المحوّل
- تحديد كمية طلبات البحث المستندة إلى الطابع الزمني
- ميزات التنظيف الشامل
Chrome 119
- نسيج عائم 32 بت قابل للفلترة
- تنسيق الرأس unorm10-10-10-2
- تنسيق النسيج rgb10a2uint
- آخر الأخبار في Dawn
Chrome 118
- إتاحة HTMLImageElement وImageData في
copyExternalImageToTexture() - إتاحة تجريبية لنسيج التخزين للقراءة والكتابة والقراءة فقط
- آخر الأخبار في Dawn
Chrome 117
- إلغاء ضبط مخزن مؤقت للرؤوس
- إلغاء ضبط مجموعة الربط
- إخفاء الأخطاء الناتجة عن إنشاء مسار غير متزامن عند فقدان الجهاز
- تعديلات على إنشاء وحدة تظليل SPIR-V
- تحسين تجربة المطوّرين
- تخزين مسارات العرض مؤقتًا باستخدام تخطيط يتم إنشاؤه تلقائيًا
- آخر الأخبار في Dawn
Chrome 116
- دمج WebCodecs
- الجهاز المفقود الذي تم إرجاعه بواسطة GPUAdapter
requestDevice() - الحفاظ على سلاسة تشغيل الفيديو عند تلقّي مكالمة على الرقم
importExternalTexture() - الامتثال للمواصفات
- تحسين تجربة المطوّرين
- آخر الأخبار في Dawn
Chrome 115
- إضافات لغة WGSL المتوافقة
- توافق تجريبي مع Direct3D 11
- الحصول على وحدة معالجة رسومات منفصلة تلقائيًا عند توصيل الجهاز بمصدر طاقة
- تحسين تجربة المطوّرين
- آخر الأخبار في Dawn
Chrome 114
- تحسين JavaScript
- تعرض الدالة getCurrentTexture() الخطأ InvalidStateError على لوحة الرسم غير المضبوطة
- تعديلات على WGSL
- آخر الأخبار في Dawn