نتائج البحث
اذهب إلى التنقل
اذهب إلى البحث
عنوان الصفحة يطابق
- ...تعلم التعزيزي''' (Reinforcement Learning - RL) و '''التعلم العميق''' (Deep Learning - DL). يهدف هذا الدمج إلى تمكين الوكلاء (Agents) ...تعلم دالة Q، والتي تقدر القيمة المتوقعة لاتخاذ فعل معين في حالة معينة. [[Q-Learning]] ...١٤ كيلوبايت (٣٢٣ كلمة) - ١٥:٣٥، ١٦ مارس ٢٠٢٥
- ...ا يأتي دور '''التعلم بالتعزيز القابل للتفسير''' (Explainable Reinforcement Learning أو XRL)، وهو مجال يهدف إلى جعل عمليات اتخاذ * **استخدام [[التعلم العميق القابل للتفسير]] (Explainable Deep Learning)** في بناء وكلاء RL أكثر شفافية. ...١٤ كيلوبايت (٢٢٣ كلمة) - ١٦:١٣، ١٦ مارس ٢٠٢٥
- '''التعلم بالتعزيز العكسي (Inverse Reinforcement Learning - IRL)''' هو فرع متطور من فروع [[التعلم الآلي]] ...١٢ كيلوبايت (١٤١ كلمة) - ١٧:٥١، ١٦ مارس ٢٠٢٥
- '''تعلم التعزيز المقيد (Constrained Reinforcement Learning - CRL)''' هو فرع متطور من [[تعلم التعزيز]] يهدف الخوارزميات الشائعة في تعلم التعزيز تشمل [[Q-Learning]]، و[[Deep Q-Network (DQN)]]، و[[Policy Gradients]]. هذه الخوا ...١٧ كيلوبايت (١٦٩ كلمة) - ١٢:٠١، ٢٦ أبريل ٢٠٢٥
- ...g) أو '''التعلم بالتعزيز القائم على السياسة''' (Policy-Based Reinforcement Learning) اللذين يعتمدان بشكل كبير على التفاعل الم 1. '''تعلم النموذج (Model Learning):''' في هذه الخطوة، يتعلم الوكيل '''نموذجًا'' ...٣٨ كيلوبايت (٤٠٧ كلمات) - ١٩:١٢، ١٦ مارس ٢٠٢٥
- ...١٤ كيلوبايت (٢١٩ كلمة) - ١٤:٠٠، ٢٦ أبريل ٢٠٢٥
نص الصفحة يطابق
- '''التعلم بالتعزيز العكسي (Inverse Reinforcement Learning - IRL)''' هو فرع متطور من فروع [[التعلم الآلي]] ...١٢ كيلوبايت (١٤١ كلمة) - ١٧:٥١، ١٦ مارس ٢٠٢٥
- ...١٤ كيلوبايت (٢١٩ كلمة) - ١٤:٠٠، ٢٦ أبريل ٢٠٢٥
- ...تعلم التعزيزي''' (Reinforcement Learning - RL) و '''التعلم العميق''' (Deep Learning - DL). يهدف هذا الدمج إلى تمكين الوكلاء (Agents) ...تعلم دالة Q، والتي تقدر القيمة المتوقعة لاتخاذ فعل معين في حالة معينة. [[Q-Learning]] ...١٤ كيلوبايت (٣٢٣ كلمة) - ١٥:٣٥، ١٦ مارس ٢٠٢٥
- ...زخمًا كبيرًا في السنوات الأخيرة هو استخدام '''التعلم بالمحاكاة (Imitation Learning)'''. هذا المقال يهدف إلى تقديم شرح مفصل وشا ...كيل من خلال التجربة والخطأ (كما هو الحال في [[التعلم المعزز (Reinforcement Learning)])، فإنه يتعلم من خلال محاولة تقليد الإجرا ...١٦ كيلوبايت (٣٠٦ كلمات) - ١٧:٤٥، ١٦ مارس ٢٠٢٥
- 3. **التعلم بالتعزيز (Reinforcement Learning):** تتعلم AlphaGo من خلال اللعب ضد نفسها. في كل * Reinforcement Learning: [https://en.wikipedia.org/wiki/Reinforcement_learning](https://en.wikipedi ...١٤ كيلوبايت (٢٥٧ كلمة) - ١١:٣٦، ١٠ مايو ٢٠٢٥
- ...ا يأتي دور '''التعلم بالتعزيز القابل للتفسير''' (Explainable Reinforcement Learning أو XRL)، وهو مجال يهدف إلى جعل عمليات اتخاذ * **استخدام [[التعلم العميق القابل للتفسير]] (Explainable Deep Learning)** في بناء وكلاء RL أكثر شفافية. ...١٤ كيلوبايت (٢٢٣ كلمة) - ١٦:١٣، ١٦ مارس ٢٠٢٥
- * [[التعلم المعزز]] (Reinforcement Learning) * [[التعلم العميق]] (Deep Learning) ...٣٧ كيلوبايت (٨٤٧ كلمة) - ٠٢:١٦، ١١ مايو ٢٠٢٥
- ...لقة بالتعلم بالتعزيز. التعلم بالتعزيز هو نوع من [[التعلم الآلي]] (Machine Learning) حيث يتعلم الوكيل كيفية اتخاذ القرارات في ...١٧ كيلوبايت (٢٢٢ كلمة) - ٢١:٠٨، ١٦ مارس ٢٠٢٥
- ...قدر مدى جودة حالة معينة أو مجموعة من الحالات. أشهر أمثلة هذه الطرق هي [[Q-Learning]] و [[SARSA]]. تعتمد هذه الطرق على إيجاد أفضل ق ...١٤ كيلوبايت (٢١٨ كلمة) - ١٣:٠١، ١٦ مارس ٢٠٢٥
- '''التعلم بالتقليد التوليدي التنافسي (Generative Adversarial Imitation Learning - GAIL)''' هو تقنية متطورة في مجال [[التعلم الآ ...علم بالتقليد]]. التعلم بالتقليد هو فرع من [[التعلم المعزز]] (Reinforcement Learning) يركز على تعلم سياسة من خلال محاكاة سلوك خ ...١٢ كيلوبايت (٢٣٠ كلمة) - ٢٠:١٤، ١٠ مايو ٢٠٢٥
- * '''التعلم المعزز (Reinforcement Learning):''' تدريب وكيل تداول باستخدام التعلم المع * '''التعلم العميق الهجين (Hybrid Deep Learning):''' دمج أنواع مختلفة من الشبكات العصبية. ...٢٢ كيلوبايت (١٬٣٥١ كلمة) - ٠٦:٤٠، ١٦ مارس ٢٠٢٥
- * **التعلم الخاضع للإشراف (Supervised Learning):** يتم تدريب الخوارزمية على مجموعة بيانات ...١٥ كيلوبايت (١٢٧ كلمة) - ١١:٥٧، ١٦ مارس ٢٠٢٥
- ...حة، وهو أساس العديد من استراتيجيات التداول الآلية. '''التعلم العميق (Deep Learning)''' هو بدوره مجموعة فرعية من التعلم الآلي ت ...١٥ كيلوبايت (٢١٤ كلمة) - ١١:٠١، ١٦ مارس ٢٠٢٥
- ...g) أو '''التعلم بالتعزيز القائم على السياسة''' (Policy-Based Reinforcement Learning) اللذين يعتمدان بشكل كبير على التفاعل الم 1. '''تعلم النموذج (Model Learning):''' في هذه الخطوة، يتعلم الوكيل '''نموذجًا'' ...٣٨ كيلوبايت (٤٠٧ كلمات) - ١٩:١٢، ١٦ مارس ٢٠٢٥
- * '''التعلم الآلي (Machine Learning):''' تتيح للأنظمة الكمبيوترية التعلم من ال * '''التعلم الخاضع للإشراف (Supervised Learning):''' يتم تدريب النظام على بيانات مصنفة. ...١٦ كيلوبايت (٢٣٢ كلمة) - ١٠:٢١، ١٦ مارس ٢٠٢٥
- ...١٥ كيلوبايت (١٤٩ كلمة) - ٢١:٠٧، ١٦ مارس ٢٠٢٥
- * '''التعلم الآلي (Machine Learning):''' يتضمن تطوير خوارزميات يمكنها التعلم م * '''التعلم المعزز (Reinforcement Learning):''' يتضمن تدريب وكيل (Agent) لاتخاذ قرارات في ...١٦ كيلوبايت (٢٥١ كلمة) - ٠٥:٤٧، ٢٥ مارس ٢٠٢٥
- ...١٧ كيلوبايت (٢٣٨ كلمة) - ١٧:٢٦، ١٤ مارس ٢٠٢٥
- * '''التعلم الآلي (Machine Learning):''' وهو القدرة على تمكين الأنظمة من التعلم * '''التعلم العميق (Deep Learning):''' وهو مجموعة فرعية من التعلم الآلي تستخد ...١٦ كيلوبايت (٢٨٠ كلمة) - ٠٥:٤٥، ٢٥ مارس ٢٠٢٥
- ...الاتجاه المعاكس للتدرج. حجم الخطوة التي يتم اتخاذها يحددها '''معدل التعلم (Learning Rate)'''. == معدل التعلم (Learning Rate) == ...١٤ كيلوبايت (٢٧٣ كلمة) - ٢١:٢١، ١٦ مارس ٢٠٢٥