0% Complete
صفحه اصلی
/
هشتمین کنفرانس بین المللی کنترل ، ابزار دقیق و اتوماسیون
Swing-up Control of a Double Inverted Pendulum by Combination of Q-Learning and PID Algorithms
نویسندگان :
Ahmad Zeynivand
1
Hoda Moodi
2
1- Tarbiat Modares University
2- Quchan University of Technology
کلمات کلیدی :
.Double Inverted Pendulum،Swing up،Reinforcement Learning،Q-Learning and PID
چکیده :
The double inverted pendulum is a nonlinear system, with unstable balance and rapid response. When two pendulums are allocated vertically and there is no movement, the system is stable. In this article, we propose a control mechanism based on reinforcement learning. By implementing the Q-Learning techniques beside the PID control scheme, the system can improve its performance and balance. In the first step, the Q-Learning algorithm is used to balance the pendulum to its inverted vertical position. In the second step, the Q-Learning algorithms is combined with classical PID, to balance the double inverted pendulum and perform swing up control. Finally, simulation results showed the effectiveness of the proposed controller
لیست مقالات
لیست مقالات بایگانی شده
Machine Learning-Based Prediction of Coronary Heart Disease
Badrosadat Nategholeslam Shirazi - Shiva Naghsh - Ali Akbar Safavi - Amir Sharafkhaneh
A new robust control for mobile robots with differential wheels:output- and state- dependent Riccati equation approach
Neda Nasiri - Ahmad Fakharian - Mohammad Bagher Menhaj
تشخیص حملات سایبری مخفی در ریزشبکههای جریان مستقیم مشارکتی براساس مدل توزیع شده
سید محمد حسینی رستمی - مهدی پورقلی - هادی اشعریون
Whale Optimization Algorithms based Fractional Order Fuzzy PID Controller for Depth of Anesthesia
Amirsaeid Safari - Kosar Safari - Mohammad Manthouri
A Simulated Annealing Approach (SA) to Vehicle Routing Problem with Time Windows (VRPTW)
Mohsen Mohammadi - Nima Mahmoodian - Hossein Mohammadi
Design and implementation of a 3D positioning and control capsule robot using magnetic waves
Hamidreza Mahmoodzadeh - Vahid Johari Majd - Abbas EhsaniSeresht
شبیه سازی بازوی 5urfd در متلب و v-rep
رضا جلالی رومی - علیرضا نقی پور - فراز جباری ایلخچی
کنترل H∞ مقاوم سیستم های سوئیچینگ خطی با زیرسیستم های پایدار و ناپایدار: رهیافت زمان توقف متوسط
حسین چهاردولی
تشخیص و جداسازی عیبها در سیستم سیال با دو مخزن با استفاده از فیلتر تشخیص عیب برد (BFDF)
حسین مصفا - حمید خالوزاده
مطالعه کنترلپذیری فرآیند جداسازی مخلوط سه جزیی تتراهیدروفوران-متانول-آب به روشهای تقطیر استخراجی متداول و یکپارچه سازی حرارتی
رضا اسلاملوئیان - ساغر معتمدی
بیشتر
ثمین همایش، سامانه مدیریت کنفرانس ها و جشنواره ها - نگارش 41.3.2