DGB-Index auf dem Prüfstand

DGB-Index auf dem Prüfstand

In der Vortragssession „Entgeltsysteme und Arbeitsgestaltung“ am 6.3. musste sich der DGB-Index Gute Arbeit einer methodischen Auseinandersetzung stellen. Nachdem Herr Ernst Kistler vom Internationalen Institut für empirische Sozialökonomie (inifes) den DGB-Index Gute Arbeit vorstellte (Fuchs & Kistler 2009), wurde im darauffolgenden Vortrag von Jochen Prümper und Gottfried Richenhagen (FHTW Berlin) eine arbeitswissenschaftliche Bewertung des Index vorgenommen. Letztgenannte Autoren kommen zu dem Schluss, dass der DGB-Index Gute Arbeit aus arbeitswissenschaftlicher Sicht nicht empfohlen werden kann, da 
a) auf Grund von Konstruktionsfehlern in der Bewertungsmethodik nur sehr wenige Arbeitsplätze das Prädikat „gute Arbeit“ erhalten können, 
b) zentrale wissenschaftliche Gütekriterien nicht überprüft wurden, und 
c) der Index sich nicht für die betriebliche Anwendung eignet.“ (Prümper & Richenhagen 2009, S. 341)

Unter anderem wurde in der Podiumsdiskussion beanstandet, dass bei der Erfassung der subjektiv erlebten Arbeitsbedingungen über den Index unklar ist, was überhaupt das Messobjekt ist, und wie sensitiv der Index misst. Darüber hinaus wurde darauf hingewiesen, dass die Terminologie des Belastungs-Beanspruchungskonzepts falsch verwendet und interpretiert wird.

Während die bereits von GdM und ifaa geäußerte Kritik an dem DGB-Index von der IG-Metall und der DGB-Index Gute Arbeit GmbH unter dem Slogan „Gesamtmetall kennt sich nicht aus, haut aber drauf“ verunglimpft wurde, mussten sich die Verantwortlichen des Index abermals vergleichbaren Kritikpunkten stellen.

Das ifaa ist ein wissenschaftliches Institut. Pauschale und vor allem unbegründete Vorwürfe, wie „offenbar haben sich die Autoren nie die Mühe gemacht, einen Blick auf www.dgb-index-gute-arbeit.de zu werfen“, können so nicht stehen gelassen werden.

Bezüglich der sogenannten Richtigstellungen von IG-Metall und der DGB-Index Gute Arbeit GmbH (Pickshaus & Stuth 2009), ist festzuhalten, dass nur die methodische und sachliche Auseinandersetzung mit dem DGB-Index zielführend und sinnvoll ist.

Folgende Kritikpunkte verhärten sich in der anhaltenden Diskussion um den DGB-Index immer mehr:
 
1. Verfahren, die den Anspruch der Wissenschaftlichkeit haben, müssen eine wissenschaftliche Methodologie aufweisen, dazu gehören Angaben über Objektivität, Reliabilität und Validität, daneben Angaben zum Messobjekt, d.h. was überhaupt gemessen werden soll. Solche Angaben liegen bislang in publizierten Medien nicht vor. Es ist unzulässig, aus nicht nachgewiesenen bedingungsbezogenen subjektiven Einschätzungen von Arbeitsbedingungen bedingungsbezogene Aussagen ableiten zu wollen.

2. Der DGB-Index 2008 stellt Zusammenhänge zwischen den erlebten Aspekten der Arbeit und dem Konstrukt Arbeitszufriedenheit dar (S.32 ff). Hier wird nicht transparent, mit welchem Instrument das Konstrukt erfasst wird, und damit wie Arbeitszufriedenheit operationalisiert wird. Außerdem ist es zweifelhaft, ein Verfahren mit einem weiteren validieren zu wollen, das ebenfalls eine Eigenkonstruktion ist, und dessen Messeigenschaften auch nicht bekannt sind. Daneben wird in der Ausgabe 3/2009 der Gewerkschaftszeitung „Gute Arbeit“ der durchschnittliche Indexwert mit den mittleren AU-Tagen unterschiedlicher Berufsgruppen in Zusammenhang gebracht. Hier wird dargestellt, dass Berufsgruppen mit relativ niedrigem DGB-Indexwert höhere AU-Raten aufweisen als Berufsgruppen mit einem höheren Indexwert. Die Güte des DGB-Index in Bezug auf die Beurteilung der Arbeitsbedingungen hieraus ableiten zu wollen, ist mehr als fraglich. Drei evidente Punkte seien genannt. 
a) Die Belastungskonstellation innerhalb einer Berufsgruppe dürfte erhebliche Unterschiede aufweisen. Ob die Befragten bei der Erhebung der Daten für den DGB-Index wirklich vergleichbare Bedingungen hatten wie die Beschäftigten, die der BKK Studie zu Grunde liegen, ist nicht gesichert. 
b) Die Autoren unterschlagen durch reine Mittelwertvergleiche die grundsätzlich nicht zu vernachlässigende interindividuelle Streuung in beiden Gruppen. 
c) Die Erfassungszeiträume von DGB-Index und AU-Tagen liegen mindestens 2 Jahre auseinander, wodurch zusätzlich die Zeitvarianz außer acht gelassen wird.

3. Unklar ist weiterhin, wie die Extraktion der Dimensionen vorgenommen wurde. In dem Methodenpapier von Fuchs (Download 21.10.2008) findet sich der Hinweis, dass die Dimensionen mit statistischen Verfahren zur Faktorenreduktion aus dem INQA-Fragebogen (2006) generiert worden seien, wobei die Autorin den Nachweis noch nicht transparent geführt hat. Zudem kamen dort einige der im DGB-Index erhobenen Statements gar nicht vor. Bei Betrachtung der einzelnen Items fällt zudem auf, dass der Bereich „Arbeitszeit“ sowohl durch die Dimension „Einflussmöglichkeiten“ als auch die Dimension „Arbeitszeit“ erfasst wird, was unplausibel ist.

4. Aus methodischer Sicht ist daneben fraglich, ob sich einzelne Dimensionen wie „soziales Klima“ oder „Sicherheit“ überhaupt zuverlässig durch nur eine Frage bzw. Item abbilden lassen. Vielmehr ist davon auszugehen, dass ein erheblicher Teil der Varianz auf interindividuelle Unterschiede anstatt auf tatsächliche Gegebenheiten zurückzuführen ist. Allerdings existieren hierzu keinerlei Angaben. Mittelwertbildung setzt mindestens Intervallskalenniveau voraus; über die Prüfung dieser Annahme, sowie Angaben zu weiteren statistischen Parametern wie Varianz, bzw. Standardabweichung, Minima und Maxima, Schiefe und Wölbung existieren in bislang vorliegenden Publikationen keine Angaben.

5. Eine Teilgesamtheit (z.B. eine Stichprobe) ist repräsentativ für die Grundgesamtheit, aus der sie entnommen wurde, wenn in ihr die interessierenden Merkmale genauso anteilig vertreten sind wie in der Grundgesamtheit selbst. Auf Anfrage zur Stichprobengröße (DGB-index 2008, S. 19) gab Herr Kistler im Rahmen der Diskussion an, dass der DGB-Index repräsentativ erhoben wurde. In wieweit die Anzahl der Beschäftigten pro Berufsgruppe aber mit der tatsächlich in der Bevölkerung vorkommenden Berufsgruppen korrespondiert, ist nicht veröffentlicht. Lediglich existiert die Angabe, dass mindestens 50 Personen in einzelnen Bereichen vertreten seien – eine Größe, die verallgemeinerbare Aussagen über einzelne Branchen schwerlich zulässt.

6. Daneben ist erkennbar, dass der Begriff der „Belastung“ offenbar nicht in der arbeitswissenschaftlich neutralen Bedeutung verwendet wird, sondern grundsätzlich eine negative Konnotation besitzt. So wird im Index das Wort „Probleme“ zur Erfassung von Belastung verwendet, was dazu führt, dass die Befragten gleich in eine eher negative Richtung gedrängt werden (semantisches Priming).

7. Weiterhin werden die Bewertungen von „Belastungen“ und „Ressourcen“ unterschiedlich bepunktet – wenn bei den „Ressourcen“ die zweitbeste Lösung gewählt wird, gibt es immerhin 83 Punkte, bei den „Belastungen“ aber nur 75 Punkte. Das bedeutet einmal, dass hier bei der Auswahl der zweitbesten Antwort „gute Arbeit“ schon nicht mehr vorhanden ist. Insgesamt führt die Konstruktion der Skalen zu einer Verzerrung, ein treffendes Beispiel zeigen Prümper und Richenhagen (2009). Des Weiteren muss gefragt werden, ob Skalen, die ein entsprechend unterschiedliches Format (Skalenbreite) haben, einfach zusammengefasst werden dürfen. Daneben verteilen sich die Punkte auch nicht gleichmäßig auf den angesetzten Skalenbereich (0 bis 100), womit auch zu erkennen ist, dass eine Mittelung der Daten immer zu einer schlechteren Bewertung führt. Die Übergewichtung der wahrgenommenen Höhe des Einkommens und der zu erwartenden Rente sowie dem Aspekt der Sicherheit führt bei geringer Bewertung immer zu einer schlechten Bewertung des Gesamt-Index, wobei damit aber keine Rückschlüsse auf die Arbeit möglich sind. 

8. Grundsätzlich ist zwischen statistischer Bedeutsamkeit und praktischer Relevanz zu differenzieren. Ob der Unterschied zwischen Vollzeit beschäftigten Männern und Frauen statistisch relevant oder von praktischer Bedeutsamkeit ist, wird z.B. im Report 2008 (S. 21 f). überhaupt nicht angegeben (vgl. Report 2008, S. 21 f). Daneben wird allgemein davon ausgegangen, dass Skalenunterschiede kleiner 5 % unbedeutend sind (z.B. Lind 2005). Entsprechend bestätigte auch Herr Kistler in der Diskussion, dass allenfalls von einer Tendenz zu sprechen ist. Unzutreffend ist damit die Behauptung, dass Vollzeit beschäftigte Frauen schlechtere Arbeitsbedingungen haben als Männer, denn tatsächlich wird ja nach einer Bewertung der Arbeitsplätze gefragt.

Referenzen:

DGB-Index Gute Arbeit 2008 – Der Report. Wie die Beschäftigten die Arbeitswelt in Deutschland beurteilen. DGB-Index Gute Arbeit GmbH (Hrsg.) http://www.dgb-index-gute-arbeit.de/downloads/publikationen/data/diga_report_08_internet.pdf.

Fuchs, T. (2006), Was ist gute Arbeit? Anforderungen aus der Sicht von Erwerbstätigen. Geschäftsstelle der Initiative Neue Qualität der Arbeit (Hrsg.). Bremerhaven: Wirtschaftsverlag NW.

Fuchs, T. (Download 21.10.2008) Der DGB-Index Gute Arbeit. http://www.dgb-index-gute-arbeit.de/downloads/publikationen/data/methodenpapier.pdf.

Fuchs, T. & Kistler, E. (2009), DGB-Index Gute Arbeit – Entwicklung und arbeitswissenschaftliche Potentiale. In: Gesellschaft für Arbeitswissenschaft (Hrsg.), Arbeit, Beschäftigungsfähigkeit und Produktivität im 21. Jahrhundert. Dortmund: GfA Press, 337-340.

Gesamtmetall (2009), Der DGB-Index „Gute Arbeit“: Hintergrund und Bewertung. http://www.gesamtmetall.de/gesamtmetall/meonline.nsf/c31231b8c4ee15bcc12569f2004efcfb/81a2bd3ad3a49439c12575610047b94f!OpenDocument
Gute Arbeit 3/2009, Tendenziös und unwissenschaftlich? Vorwürfe gegen den DGB-Index halten der Überprüfung nicht stand. Interview mit T. Fuchs und E. Kistler.

Lind, G. (2005), Effektstärken: Statistische versus praktische und theoretische Bedeutsamkeit. http://www.uni-konstanz.de/ag-moral/pdf/Lind-2005_Effektstaerke-Vortrag.pdf. (Download 1.2.2008)

Pickshaus, K. & Stuth, R. (2009), Antwort auf Gesamtmetall. http://www.igmetall.de/cps/rde/xbcr/internet/Antwort%20auf%20Gesamtmetall_0142916.pdf (Download 25.2.2009)

Prümper, J. & Richenhagen, G. (2009), Der DGB-Index „Gute Arbeit“ – eine arbeitswissenschaftliche Bewertung. In: Gesellschaft für Arbeitswissenschaft (Hrsg.), Arbeit, Beschäftigungsfähigkeit und Produktivität im 21. Jahrhundert. Dortmund: GfA Press, 341-344.