Selbstoptimierende dezentrale Fertigungssteuerung (SelF)
Leitung: | Prof. Dr.-Ing. Berend Denkena |
E-Mail: | fohlmeister@ifw.uni-hannover.de |
Team: | Silas Fohlmeister |
Jahr: | 2020 |
Datum: | 30-01-20 |
Förderung: | DFG |
Laufzeit: | 01/2020-06/2022 |
Die Fertigungssteuerung hat als Teil der Arbeitsvorbereitung die Aufgabe, die mittel- bis langfristige Fertigungsplanung kurzfristig umzusetzen. Im Rahmen dieses Projekts wird dabei vor allen Dingen die Terminierung der freigegebenen Aufträge auf den zur Verfügung stehenden Maschinen sowie deren Reihenfolgebildung untersucht. Insbesondere für den Anwendungsfall der Werkstattfertigung weist das zugrundeliegende Optimierungsproblem eine hohe Komplexität auf, die die Berechnung optimaler Belegungspläne unmöglich macht. Daher werden oftmals regelbasierte Heuristiken angewendet, die je nach Detaillierungsgrad entweder sehr ungenaue Lösungen liefern oder für genauere Lösungen einen hohen Rechen- und Zeitaufwand verursachen. Durch eine Dezentralisierung und damit lokale Beschränkung der Steuerungsentscheidungen kann das Optimierungsproblem reduziert werden. Folglich können Steuerungsentscheidungen dezentral nahezu in Echtzeit mit geringem Aufwand für die Datenerfassung und -verarbeitung getroffen werden. Dabei werden allerdings nicht die Auswirkungen der lokalen Entscheidungen auf das Gesamtsystem berücksichtigt, wodurch die resultierenden Belegungspläne deutlich schlechter sein können, als welche, die über zentrale Heuristiken gebildet wurden.
Aus diesem Grund wird in diesem Projekt eine Methode für eine dezentrale Fertigungssteuerung entwickelt und erforscht, deren Entscheidungsfindung unter Berücksichtigung globaler Fertigungskennzahlen optimiert wird. Zu diesem Zweck wird ein Multiagentensystem implementiert, dessen Softwareagenten die Maschinen und Aufträge des Fertigungssystems repräsentieren und über Sensoren und Kommunikation lokal Daten aggregieren und Entscheidungen treffen können. Diese Entscheidungen werden mittels bestärkendem Lernen optimiert. Dabei wird das Deep Q-Learning verwendet, da dieser Algorithmus auch für komplexe Anwendungsfälle ein stabiles Lernverhalten aufweist. Die Grundidee ist dabei, dass sequenziell getroffene Steuerungsentscheidungen durch eine Belohnungsfunktion basierend auf Fertigungskennzahlen aus der globalen Datenerfassung bewertet und zukünftige Steuerungsentscheidungen entsprechend optimiert werden. Auf diese Weise lernt und optimiert der Algorithmus iterativ Entscheidungsstrategien für die Fertigungssteuerung, die einerseits dezentral in Echtzeit getroffen werden und andererseits die für Unternehmen relevanten globalen Fertigungskennzahlen optimieren.