نتائج البحث
		
		
		
		اذهب إلى التنقل
		اذهب إلى البحث
		
عنوان الصفحة يطابق
- ...تعلم التعزيزي''' (Reinforcement Learning - RL) و '''التعلم العميق''' (Deep Learning - DL). يهدف هذا الدمج إلى تمكين الوكلاء (Agents) ...تعلم دالة Q، والتي تقدر القيمة المتوقعة لاتخاذ فعل معين في حالة معينة. [[Q-Learning]] ...١٤ كيلوبايت (٣٢٣ كلمة) - ١٥:٣٥، ١٦ مارس ٢٠٢٥
 - ...ا يأتي دور '''التعلم بالتعزيز القابل للتفسير''' (Explainable Reinforcement Learning أو XRL)، وهو مجال يهدف إلى جعل عمليات اتخاذ * **استخدام [[التعلم العميق القابل للتفسير]] (Explainable Deep Learning)** في بناء وكلاء RL أكثر شفافية. ...١٤ كيلوبايت (٢٢٣ كلمة) - ١٦:١٣، ١٦ مارس ٢٠٢٥
 - '''التعلم بالتعزيز العكسي (Inverse Reinforcement Learning - IRL)''' هو فرع متطور من فروع [[التعلم الآلي]] ...١٢ كيلوبايت (١٤١ كلمة) - ١٧:٥١، ١٦ مارس ٢٠٢٥
 - '''تعلم التعزيز المقيد (Constrained Reinforcement Learning - CRL)''' هو فرع متطور من [[تعلم التعزيز]] يهدف الخوارزميات الشائعة في تعلم التعزيز تشمل [[Q-Learning]]، و[[Deep Q-Network (DQN)]]، و[[Policy Gradients]]. هذه الخوا ...١٧ كيلوبايت (١٦٩ كلمة) - ١٢:٠١، ٢٦ أبريل ٢٠٢٥
 - ...g) أو '''التعلم بالتعزيز القائم على السياسة''' (Policy-Based Reinforcement Learning) اللذين يعتمدان بشكل كبير على التفاعل الم 1. '''تعلم النموذج (Model Learning):''' في هذه الخطوة، يتعلم الوكيل '''نموذجًا'' ...٣٨ كيلوبايت (٤٠٧ كلمات) - ١٩:١٢، ١٦ مارس ٢٠٢٥
 - ...١٤ كيلوبايت (٢١٩ كلمة) - ١٤:٠٠، ٢٦ أبريل ٢٠٢٥
 
نص الصفحة يطابق
- '''التعلم بالتعزيز العكسي (Inverse Reinforcement Learning - IRL)''' هو فرع متطور من فروع [[التعلم الآلي]] ...١٢ كيلوبايت (١٤١ كلمة) - ١٧:٥١، ١٦ مارس ٢٠٢٥
 - ...١٤ كيلوبايت (٢١٩ كلمة) - ١٤:٠٠، ٢٦ أبريل ٢٠٢٥
 - ...تعلم التعزيزي''' (Reinforcement Learning - RL) و '''التعلم العميق''' (Deep Learning - DL). يهدف هذا الدمج إلى تمكين الوكلاء (Agents) ...تعلم دالة Q، والتي تقدر القيمة المتوقعة لاتخاذ فعل معين في حالة معينة. [[Q-Learning]] ...١٤ كيلوبايت (٣٢٣ كلمة) - ١٥:٣٥، ١٦ مارس ٢٠٢٥
 - ...زخمًا كبيرًا في السنوات الأخيرة هو استخدام '''التعلم بالمحاكاة (Imitation Learning)'''. هذا المقال يهدف إلى تقديم شرح مفصل وشا ...كيل من خلال التجربة والخطأ (كما هو الحال في [[التعلم المعزز (Reinforcement Learning)])، فإنه يتعلم من خلال محاولة تقليد الإجرا ...١٦ كيلوبايت (٣٠٦ كلمات) - ١٧:٤٥، ١٦ مارس ٢٠٢٥
 - 3. **التعلم بالتعزيز (Reinforcement Learning):** تتعلم AlphaGo من خلال اللعب ضد نفسها. في كل * Reinforcement Learning: [https://en.wikipedia.org/wiki/Reinforcement_learning](https://en.wikipedi ...١٤ كيلوبايت (٢٥٧ كلمة) - ١١:٣٦، ١٠ مايو ٢٠٢٥
 - ...ا يأتي دور '''التعلم بالتعزيز القابل للتفسير''' (Explainable Reinforcement Learning أو XRL)، وهو مجال يهدف إلى جعل عمليات اتخاذ * **استخدام [[التعلم العميق القابل للتفسير]] (Explainable Deep Learning)** في بناء وكلاء RL أكثر شفافية. ...١٤ كيلوبايت (٢٢٣ كلمة) - ١٦:١٣، ١٦ مارس ٢٠٢٥
 - * [[التعلم المعزز]] (Reinforcement Learning) * [[التعلم العميق]] (Deep Learning) ...٣٧ كيلوبايت (٨٤٧ كلمة) - ٠٢:١٦، ١١ مايو ٢٠٢٥
 - ...لقة بالتعلم بالتعزيز. التعلم بالتعزيز هو نوع من [[التعلم الآلي]] (Machine Learning) حيث يتعلم الوكيل كيفية اتخاذ القرارات في ...١٧ كيلوبايت (٢٢٢ كلمة) - ٢١:٠٨، ١٦ مارس ٢٠٢٥
 - ...قدر مدى جودة حالة معينة أو مجموعة من الحالات. أشهر أمثلة هذه الطرق هي [[Q-Learning]] و [[SARSA]]. تعتمد هذه الطرق على إيجاد أفضل ق ...١٤ كيلوبايت (٢١٨ كلمة) - ١٣:٠١، ١٦ مارس ٢٠٢٥
 - '''التعلم بالتقليد التوليدي التنافسي (Generative Adversarial Imitation Learning - GAIL)''' هو تقنية متطورة في مجال [[التعلم الآ ...علم بالتقليد]]. التعلم بالتقليد هو فرع من [[التعلم المعزز]] (Reinforcement Learning) يركز على تعلم سياسة من خلال محاكاة سلوك خ ...١٢ كيلوبايت (٢٣٠ كلمة) - ٢٠:١٤، ١٠ مايو ٢٠٢٥
 - * '''التعلم المعزز (Reinforcement Learning):''' تدريب وكيل تداول باستخدام التعلم المع * '''التعلم العميق الهجين (Hybrid Deep Learning):''' دمج أنواع مختلفة من الشبكات العصبية. ...٢٢ كيلوبايت (١٬٣٥١ كلمة) - ٠٦:٤٠، ١٦ مارس ٢٠٢٥
 - * **التعلم الخاضع للإشراف (Supervised Learning):** يتم تدريب الخوارزمية على مجموعة بيانات ...١٥ كيلوبايت (١٢٧ كلمة) - ١١:٥٧، ١٦ مارس ٢٠٢٥
 - ...حة، وهو أساس العديد من استراتيجيات التداول الآلية. '''التعلم العميق (Deep Learning)''' هو بدوره مجموعة فرعية من التعلم الآلي ت ...١٥ كيلوبايت (٢١٤ كلمة) - ١١:٠١، ١٦ مارس ٢٠٢٥
 - ...g) أو '''التعلم بالتعزيز القائم على السياسة''' (Policy-Based Reinforcement Learning) اللذين يعتمدان بشكل كبير على التفاعل الم 1. '''تعلم النموذج (Model Learning):''' في هذه الخطوة، يتعلم الوكيل '''نموذجًا'' ...٣٨ كيلوبايت (٤٠٧ كلمات) - ١٩:١٢، ١٦ مارس ٢٠٢٥
 - * '''التعلم الآلي (Machine Learning):''' تتيح للأنظمة الكمبيوترية التعلم من ال * '''التعلم الخاضع للإشراف (Supervised Learning):''' يتم تدريب النظام على بيانات مصنفة. ...١٦ كيلوبايت (٢٣٢ كلمة) - ١٠:٢١، ١٦ مارس ٢٠٢٥
 - ...١٥ كيلوبايت (١٤٩ كلمة) - ٢١:٠٧، ١٦ مارس ٢٠٢٥
 - * '''التعلم الآلي (Machine Learning):''' يتضمن تطوير خوارزميات يمكنها التعلم م * '''التعلم المعزز (Reinforcement Learning):''' يتضمن تدريب وكيل (Agent) لاتخاذ قرارات في ...١٦ كيلوبايت (٢٥١ كلمة) - ٠٥:٤٧، ٢٥ مارس ٢٠٢٥
 - ...١٧ كيلوبايت (٢٣٨ كلمة) - ١٧:٢٦، ١٤ مارس ٢٠٢٥
 - * '''التعلم الآلي (Machine Learning):''' وهو القدرة على تمكين الأنظمة من التعلم * '''التعلم العميق (Deep Learning):''' وهو مجموعة فرعية من التعلم الآلي تستخد ...١٦ كيلوبايت (٢٨٠ كلمة) - ٠٥:٤٥، ٢٥ مارس ٢٠٢٥
 - ...e explored in [[Deep Reinforcement Learning for Trading|Deep Reinforcement Learning for Trading]], require significant experience. ...١٠ كيلوبايت (١٬٥٦٣ كلمة) - ٠٢:١٩، ٣ أكتوبر ٢٠٢٥