الفصل 36., القسم 1. إطار عمل تقييم البرامج: بوابة إلى الأدوات - القسم الرئيسي

لماذا نقيّم برامج الصحة والتنمية المجتمعية؟
كيف نقيّم برنامجاً محدداً؟
ما هي "معايير" التقييم الجيدة؟
تطبيق إطار العمل: إجراء التقييمات الأمثل

تقوم في مختلف أرجاء العالم برامج وتدخلات كثيرة جرى تطويرها من أجل تحسين الظروف في المجتمعات المحلية. فالناس يجتمعون معاً للعمل على خفض مستوى العنف السائد، أو لتوفير سكن محمول الكلفة لكل الناس، أو لمساعدة الطلاب على أداء أفضل في المدارس – على سبيل المثال.

ولكن كيف نعرف إن كانت هذه البرامج فعالة؟ فإن لم تكن فعالة – وحتى لو كانت كذلك، فكيف لنا أن نجعلها أفضل لصالح الناس المحليين؟ وأخيراً، كيف تستطيع منظمة أن تتخذ خيارات ذكية في ما يتعلق بالبرامج التي يحتمل أن تنجح في ذلك المجتمع؟

على امتداد السنوات الماضية، ازداد الميل نحو استخدام التقييم لفهم الممارسات وتحسينها. لقد حلّ الاستخدام المنتظم للتقييم مشكلات كثيرة كما ساعد أعداداً لا تحصى من المنظمات المجتمعية على أن يفعلوا ما يُحسنوا عمله.

على الرغم من ازدياد القدرة على فهم الحاجة إلى التقييم وإلى استخدامه، بقيت الحاجة إلى إطار عمل متفق عليه لتقييم البرامج قائمة. وفي العام 1997 أدرك العلماء في المركز الأمريكي لمكافحة الأمراض ومنعها CDC، الحاجة إلى تطوير مثل هذا الإطار. نتيجةً لذلك، شكل المركز مجموعة عمل على التقييم ضمّت خبراء في حقلي الصحة العامة والتقييم. وطُلب من أعضاء المجموعة تطوير إطار يلخص وينظم العناصر الأساسية في تقييم البرامج. هذا القسم في "عدة العمل المجتمعي" يصف الإطار الناجم عن جهود مجموعة العمل.

على وجه التحديد سنقوم في هذا القسم بالتالي:

مناقشة مزايا تقييم برنامج محدد
شرح كيفية تقييم برنامج محدد
توفير معايير قياسية للتقييم الجيد
مناقشة كيف يمكن لمجموعتكم أن تطبق الإطار، وبالتالي كيف يمكن للمجموعات أن تنفذ التقييم الأمثل.

الأداة 1 (أنظر "الأدوات") تزودكم بروابط إلى معلومات عن كيفية التنفيذ في "عدة العمل المجتمعي"، أي معلومات تتصل بعمليات التقييم. لكن، قبل أن نبدأ، نود أن نقدم بعض التعريفات لمصطلحات سيجري استخدامها في هذا الجزء.

التقييم: المقصود هنا التحقيق المنظم في أهلية وقيمة وأهمية شيء أو جهد ما. لقد تغيرت ممارسة التقييم بشكل كبير في العقود الثلاثة الماضية: فقد جرى تطوير طرائق ومقاربات جديدة، وهو – أي التقييم – يستخدم اليوم بشكل متزايد في مشاريع متنوعة.

البرامج: في كل هذا الجزء، نستخدم كلمة "برامج" لوصف الشيء أو الجهد الذي يجري تقييمه. وهذا ينطبق على أي عمل يستهدف تحسين النتائج لمصلحة مجتمعات محلية بكاملها، أو لقطاعات محددة أكثر (المدارس، أماكن العمل، مثلاً)، أو لمجموعات فرعية (كالشباب، أو أشخاص يعانون العنف أو مصابين بفيروس HIV أو الإيدز). يقصد بهذا التعريف أن يكون عريضاً للغاية.

الأمثلة على الأنواع المختلفة من البرامج يمكن أن تشمل:

التدخلات الخدماتية المباشرة (كبرنامج يوفر فطوراً مجانياً لتحسين التغذية لتلاميذ المدارس الإبتدائية).
جهود لتعبئة مجتمع محلي (تنظيم حملة مقاطعة منتوجات زراعية من أجل تحسين أحوال العمال الزراعيين).
مبادرات بحثية (كاستكشاف ما إذا كان من الممكن خفض التفاوت في الأوضاع الصحية بين المدن والأرياف أو بسبب الانتماء إلى أقلية معينة أو عِرق معين).
نظم المسح (مثلاً: هل الاكتشاف المبكر للاستعداد لدخول المدرسة يحسّن المخرَجات التربوية؟).
أعمال المناداة أو المناصرة (كتنظيم حملة للتأثير على المشرّعين ودفعهم إلى تمرير تشريع حول منع التبغ).
حملة تسويق اجتماعي (مثلاً، حملة لتشجيع الأمهات على الإرضاع الطبيعي وخفض معدل وفيات الرضّع).
مشاريع البنية التحتية (كبرنامج لبناء قدرات الوكالات الحكومية على دعم مبادرات التنمية المجتمعية).
برامج التدريب (كبرنامج تدريب وظيفي لخفض البطالة في الأحياء الحضرية).
النظم الإدارية (كبرنامج لتحسين فعالية الخدمات الصحية).

تقييم البرامج: أي نوع التقييم الذي نناقشه في هذا القسم يمثل ممارسةً تنظيمية جوهرية لكل أعمال الصحة والتنمية المجتمعية. إنه طريقة في تقييم مشاريع وأنشطة محددة يمكن أن تشارك فيها مجموعات محلية أكثر تقييم منظمة بأكملها أو تقييم مبادرة مجتمعية شاملة.

أصحاب المصلحة: يشير هذا المصطلح إلى أولئك الذين يهمهم البرنامج أو الجهد – أو يراهنون عليه. من هؤلاء هناك الأشخاص الذين يفترض أنهم يستفيدون (كالأطفال وأهلهم أو من يرعاهم) أو أصحاب النفوذ المحدد (كالمسؤولين المنتخبين أو المعيّنين) أو أولئك الذين يعارضونه ( أي خصوم البرنامج أو الجهد المتحملين). والسؤالان الرئيسيان عن "أصحاب المصلحة" هما: مَن يهمه الأمر؟ وما الذي يهمه فيه؟

يقدم هذا القسم، إطار عمل يعزز الفهم المشترك لتقييم البرنامج. الهدف الأعلى هو أن نسهّل على كل مَن يشترك في أعمال الصحة والتنمية المجتمعية تقييم جهودهم.

لماذا نقيّم برامج الصحة والتنمية المجتمعية؟

إن التقييم الذي نتحدث عنه في هذا القسم هو من النوع الذي يمكن ربطه بسهولة بعمليات البرنامج اليومية. والتشديد هنا هو على التقييم العملي والمتواصل الذي يشرك جميع العاملين في البرنامج وأعضاء المجتمع المحلي وأصحاب مصلحة آخرين، أي أنه لا يقتصر على خبراء التقييم. ويوفر هذا النوع من التقييم مزايا للمهنيين العاملين في صحة وتنمية المجتمع المحلي. على سبيل المثال، فهو يكمل عمل مديري البرامج من خلال:

المساعدة على توضيح خطط البرنامج
تحسين التواصل بين شركاء البرنامج
جمع المردود (التغذية المرتدة) اللازم لتحسين فعالية البرنامج والمسؤولية عنه.

من المهم أن نتذكر أيضاً أن التقييم ليس نشاطاً جديداً بالنسبة إلى أولئك العاملين بيننا على تحسين مجتمعاتنا المحلية. في الواقع، نحن نقيس جدارة عملنا طوال الوقت وذلك عندما نطرح أسئلة، ونشاور الشركاء، ونجري تقديرات وقياسات بناء على المردود، ثم نستعمل هذه الأحكام من أجل تحسين العمل. وفي الحالات التي يكون فيها الرهان منخفضاً، فإن هذا النوع من التقييم غير الرسمي يمكن أن يكون كافياً. ولكن، وعندما يكبر الرهان والأهداف - أي عندما يتعلق الأمر بكثير من المال والوقت أو عندما يكبر عدد الناس المتأثرين - عندها يصبح من المعقول أن تستخدم منظمتكم إجراءات تقييم أكثر رسمية، ومنظورة ومبررة.

كيف نقيّم برنامجاً محدداً؟

قبل أن تبدأ منظمتكم بتقييم البرنامج ينبغي أن تكون الأجوبة عن الأسئلة التالية واضحة تماماً لمجموعتكم. ولتوضيح المقصود بكل جواب دعونا ننظر في بعض الردود في برنامج افتراضي هدفه منع القيادة والشرب، (أو منع القيادة المتهورة أو صدم الأطفال والتلاميذ...)

"القيادة الذكية" برنامج يركز على خفض حالات القيادة بعد الشرب من خلال التوعية العامة والتدخل (أو على سلامة الأطفال عند قطع الشوارع بأمان أي خفض ).

ما هي المعايير التي تستخدم في الحكم على أداء البرنامج (يمكن تعديل الأسئلة بحسب البرنامج)؟

عدد سكان المجتمع المحلي الذين باتوا يعرفون البرنامج وأهدافه
عدد الناس الذين يستخدمون المتطوعين في نقلهم إلى منازلهم - بعد الشرب- أو يساعدون الأطفال على قطع الطرقات بأمان.
النسبة المئوية من الناس الذي يبلغون عن حالات القيادة والشرب أو القيادة المتورة التي تهدد سلامة الناس.
الرقم المعروف عن حوادث التدهور أو الإصطدام المفردة أي في سيارة واحدة ليلاً (هذه طريقة شائعة في تحديد ما إذا كان عدد الأشخاص الذين يقودون ثملين قد تغيّر) (أو عدد الأطفال الذين يتعرضون للصدم أثناء قطع الشوارع)

ما الأرقام القياسية في الأداء التي يجب الوصول إليها في معايير الأداء؟

80% من سكان المجتمع المحلي يعرفون عن البرنامج وأهدافه بعد السنة الأولى من إطلاقه
عدد الأشخاص الذين يستخدمون سيارات أجرة (بدلاً من سياراتهم) سيزداد 20% في السنة الأولى (أو عدد حوادث صَدْم الأطفال سيتراجع 20%)
نسبة الأشخاص الذين يبلغون عن حالات القيادة بعد الشرب سيتراجع 20% في السنة الأولى
عدد حوادث الاصطدام/ التدهور الليلية المنفردة (أو صدم التلاميذ) سيتراجع 10% في أول سنتين من البرنامج.

ما الدليل الذي يمكن أن يشير إلى الأداء بناءً على المعايير القياسية؟

استطلاع عشوائي بالهاتف يُظهر مدى معرفة السكان عن البرنامج والتغيير في السلوك
سجل الوارد من "متطوعي" النقل الآمن الذي يخبرنا عن عدد الأشخاص الذين يستخدمون هذه الخدمة (أو من مجموعات "القطع الآمن")
المعلومات عن حوادث الاصطدام/ التدهور/ الصدم التي يمكن جمعها من سجلات الشرطة

ما الذي نستنتجه من أداء البرنامج بناءً على الدليل المتاح؟

هل أن التغيير الذي حصل نتيجة لجهودنا نحن أم نتيجة أمر آخر؟ أو (هل إن تغييراً لم يحصل أو أن التغيير ليس كافياً في سلوك الأشخاص أو في النتيجة)
هل على مجموعات "القيادة الذكية" (أو مجموعات قطع الشارع بأمان) أن تغير طريقة العمل أم أننا لم ننتظر بما يكفي لنرى النتائج؟

يقدم إطار العمل التالي نهجا منظماً في الإجابة عن هذه الأسئلة

إطار عمل لتقييم البرنامج

يوفر للبرنامج طريقة لفهم وتحسين الممارسات في مجال صحة وتنمية المجمع باستعمال طرائق مفيدة وملائمة ودقيقة وفي المتناول. إطار العمل الموصوف أدناه هو أداه عملية مرنة تلخّص في ترتيب منطقي العناصر المهمة في تقييم البرامج. يحتوي الإطار بُعدَين مترابطين:

خطوات في ممارسة التقييم
مقاييس التقييم "الجيد"

الشكل الأول يظهر إطار العمل:

كلام الشكل: خطوات في التقييم

إشراك أصحاب المصلحة

وصف البرنامج

تركيز مخطط التقييم

جمع أدلة صادقة

تبرير الاستنتاجات

مقاييس التقييم "الجيد"

ضمان الاستخدام وتشارك الدروس المستخلصة

المنفعة

الجدوى

الملاءمة

الدقة

خطوات الإطار الست تمثل أعمالاً ينبغي أن تكون جزءاً من أي تقييم. وقد نصادف الخطوات في الممارسة في شكل غير متسلسل، إلا أن المنطق يقول باتباعها في التسلسل الموصى به. ويعود ذلك إلى أن الخطوات الأسبق توفر الأساس لإحراز تقدم لاحق. وبذلك، فإن تقرير كيفية تنفيذ خطوة معينة يجب ألا يتم بشكل نهائي ما لم يجر التعامل مع الخطوات التي تسبقها.

إلا أن المقصود بهذه الخطوات ألا تكون جامدة بل قابلة للتكييف. فمن الأساسي لتنفيذ تقييم جيد أن نتمتع بحساسية إزاء السياق الفريد الخاص به (تاريخ البرنامج ومناخه التنظيمي، مثلاً). الغرض من الخطوات أن تخدم كنقاط انطلاق يمكن للمجتمعات المحلية أن تفصّل حولها تقييماً يلبي احتياجاتها على أفضل وجه.

خطوات في التقييم

الخطوات الست هي:

إشراك أصحاب المصلحة – أو "أصحاب الرهان"
وصف البرنامج
تركيز مخطط التقييم
جمع أدلة صادقة
تبرير الاستنتاجات
ضمان الاستخدام وتشارك الدروس المستخلصة.

إن فهم هذه الخطوات الأساسية الست والالتزام بها سيؤدي إلى تحسين معظم جهود التقييم. انظر أداة العمل 1 من أجل الوصول إلى أقسام أخرى من "عدة العمل المجتمعي" والتي يمكنها أن تساعدكم على تنفيذ الخطوات الست في إطار العمل.

الجزء الثاني من إطار العمل هو طقم من المقاييس المعيارية لقياس جودة أنشطة التقييم. هناك 30 مقياساً منظمة في المجموعات الأربع التالية:

المنفعة
الجدوى
الملاءمة
الدقة

هذه المعايير القياسية (سْتانْدرد) تساعد على الإجابة عن السؤال: "هل سيكون هذا التقييم تقييماً جيداً؟". ونحن نوصي باستعمالها بوصفها المعايير المبدئية التي تساعد على الحكم على نوعية أنشطة تقييم البرنامج.

دعونا، بدايةً، نلقي نظرة على الخطوات المحددة في تقييم البرنامج. وبعدها ننظر في هذا القسم على المعايير القياسية المحددة في التقييم "الجيد".

خطوات في تقييم البرنامج

إشراك أصحاب المصلحة

"أصحاب المصلحة" (أو المراهنون) هم الناس أو المنظمات الذين يمكن أن يكسبوا أو يخسروا شيئاً ما من نتيجة التقييم وكذلك مما سيترتب على هذه النتيجة. لا يمكن إجراء التقييم في عزلة. إذ يكاد كل ما يحصل في صحة وتنمية المجتمع المحلي يشمل شراكات، أي تحالفات بين المنظمات، وأعضاء مجالس الإدارة، والمتأثرين بالمشكلة وآخرين. لذلك، على أي جهد جدي لتقييم البرنامج أن يراعي القيم المختلفة عند الشركاء. ويجب أن يكون أصحاب المصلحة جزءاً من التقييم لكي يضمنوا أن وجهات نظرهم قد جرى فهمها. أما حين لا يجري إشراك أصحاب المصلحة إشراكاً ملائماً فالأرجح أن يحصل تجاهل أو انتقاد أو مقاومة للنتائج.

بالمقابل، فإذا كانوا طرفاً في عملية التقييم فهم يمكن أن يشعروا إلى حدٍ بعيد بتملك عملية التقييم ونتائجها. وقد يرغبون في تطوير العملية والدفاع عنها وضمان أن ينجح التقييم فعلاً.

لذلك يبدأ التقييم بإشراك أصحاب المصلحة. وفور إشراكهم كان الناس سيساعدون على تنفيذ كل خطوة من الخطوات التالية. وهناك ثلاث مجموعات رئيسية من أصحاب المصلحة من المهم إشراكهم:

أولئك المشاركون في إدارة البرنامج
أولئك الذين يخدمهم البرنامج أو يتأثرون به
أولئك الذين يستخدمون التقييم في الدرجة الأولى.

دعونا نلقي نظرة على كل مجموعة على حدة.

الناس أو المنظمات المشاركة في عمليات البرنامج يمكن أن يضموا أفراداً من المجتمع المحلي، أفراداً من الأسر، منظمات الأحياء أو الجيرة، شركاء الائتلافات، موظفي التمويل، الإداريين، والمدراء والطاقم.
الناس أو المنظمات الذين يخدمهم البرنامج أو يتأثرون به يمكن أن يضموا عملاء، أفراداً في الأسر، منظمات الأحياء، المعاهد الأكاديمية، الرسميين المعنيين والمنتخبين، مجموعات المناداة أو المناصرة، وسكان المجتمع المحلي. وقد يكون من المهم إشراك الأفراد الذين يشككون في البرنامج أو يعادونه. إن فتح التقييم على وجهات نظر متعارضة واستدراج المساعدة من خصوم البرنامج المحتملين يمكن أن يعزز مصداقية التقييم. لمزيد من المعلومات، انظروا الفصل 30، القسم 6 عن: تشجيع مشاركة الخصوم كما الحلفاء.

وعلى وجه مماثل، فإن الأفراد والمجموعات الذين يمكن أن يتأثروا سلباً بالتغييرات الناجمة عن التقييم لهم الحق في المشاركة. مثلاً، من المهم أن نشمل أولئك الذين سيتأثرون إذا ما جرى توسيع البرنامج، أو تغييره، أو الحد منه أو إنهائه نتيجةً للتقييم.

مستخدمو التقييم الأساسيون المستهدَفون هم على وجه التحديد الأفراد الذين يوجدون في موقع يتيح لهم أن يقرروا النتائج وأن يفعلوا شيئاً حيالها. وعلينا ألا نخلط بينهم وبين مستخدمي البرنامج المستهدفين، مع أن بعضهم يجب أن يُشْرَك في هذه المجموعة. في الواقع، فإن المستخدِمين الأساسيين المستهدَفين ينبغي أن يشكلوا مجموعة فرعية من مجمل أصحاب المصلحة الذين جرى تحديدهم. التقييم الناجح يحدد المستخدِمين الأساسيين المستهدَفين مثل طاقم البرنامج والممولين، وذلك في مرحلة مبكرة من صياغته، ويحافظ على تفاعل متكرر معهم لضمان أن يلبي التقييم قيمهم واحتياجاتهم على وجه التحديد.

إن مدى انخراط أصحاب المصلحة، ونوعه، يختلفان من تقييم إلى آخر. على سبيل المثال، يمكن أن يشارك أصحاب المصلحة مباشرةً في تصميم وتنفيذ التقييم. ويمكن استخدام اجتماعات دورية وتقارير ووسائل اتصال أخرى لإبقائهم على علم بتقدم التقييم.

عند العمل مع هكذا مجموعة قد يكون من المفيد تطوير عملية صريحة من أجل تشارك السلطة وحل النزاعات. يمكن أن يساعد ذلك على تجنب التشديد الزائد على قيم أي فرد من أصحاب المصلحة. الفصل 20، القسم 6 عن "التدريب على حل النزاعات" يمكن أن يفيد في إقامة مثل هذه العملية.

يمكن إيجاد مزيد من المعلومات عن تحديد أصحاب المصلحة والعمل معهم في:

الفصل 20،القسم 3: "فهم قادة المجتمع المحلي، والمقيّمين والممولين: ما هي مصالحهم؟"
الفصل 18،القسم 3: "تحديد الأهداف وعوامل التغيير: من يمكن أن ينتفع ومن يمكن أن يساعد؟"

وصف البرنامج

وصف البرنامج هو ملخص التدخل الذي يجري تقييمه، وعليه أن يشرح ما يحاول البرنامج أن ينجزه وكيف يحاول أن يحقق هذه التغيرات. وسيصور الملخص المكوّنات والعناصر الجوهرية، وقدرة البرنامج على إحداث التغيير، والمرحلة التي وصل إليها في تطوره، وكيف يناسب البرنامج البيئة التنظيمية والمجتمعية الأوسع.

إن كيفية وصف البرنامج ترسم الإطار المرجعي لكل القرارات المستقبلية الخاصة بتقييمه. مثلاً، إذا وُصف البرنامج على أنه "يحاول أن يقوي تطبيق القوانين التي تَنهى عن التدخين (أو الشرب) تحت السن القانونية"، فإن التقييم قد يكون مختلفاً تماماً عما لو كان وُصف على أنه "برنامج لخفض تدخين النرجيلة (أو القيادة المخمورة) عند الشباب دون العشرين". كذلك، فالوصف يتيح لأعضاء المجموعة أن يقارنوا البرنامج بجهود مماثلة أخرى، ويسهّل اكتشاف تلك الأجزاء من البرنامج التي أحدثت التغيير. للمزيد من المعلومات أنظروا من الفصل18،القسم 1: "تصميم التدخلات المجتمعية".

فضلاً عن ذلك، فإن أصحاب المصلحة المختلفين قد تكون لديهم أفكار مختلفة عما يُفترض أن يُنجزه البرنامج. مثلاً، إن برنامجاً يستهدف خفض حالات التزويج المبكر قد يدفع بعض الأعضاء إلى الاعتقاد بأن ذلك قد يشجع على "تدهور الأخلاق" ويشكل مخاطر على الشباب والشابات، فيما غيرهم يرى أن ذلك يزيد من الأعباء الاجتماعية والاقتصادية على الأسرة (مثال آخر من مجتمعات تعاني هذه المشكلة: خفض حالات حمل المراهقات: البعض يراه تشجيعاً على الوصول إلى موانع الحمل وبعض آخر يراه تركيزاً على الامتناع عن ممارسة الجنس فحسب).

أي تقييم يُجرى من دون اتفاق على تعريف البرنامج قد لا ينفع تماماً. وفي حالات كثيرة، فإن عملية العمل مع أصحاب المصلحة على تطوير وصف واضح ومنطقي للبرنامج يأتي بمنافع تسبق بكثير إيجاد بيانات لقياس فعالية البرنامج.

الجوانب المحددة التي يجب أن يشملها وصف البرنامج:

الحاجة
التوقعات
الأنشطة
الموارد
مرحلة التطور
السياق (البيئة المحلية للبرنامج)
النموذج المنطقي

دعونا ننظر في كل جانب، واحداً بعد آخر:

بيان الحاجة يصف المشكلة أو الهدف أو الفرصة التي يخاطبها البرنامج، وهو يبدأ بطرح ما سيفعله البرنامج للرد عل ذلك. الأوجه المهمة التي يجب أن تراعي في ما يتعلق بالحاجة إلى البرنامج تشمل: طبيعة المشكلة أو الهدف، من يتأثر بالمشكلة أو الهدف، ما حجم المشكلة أو الهدف وما وكيف يتغيران. للمزيد من المعلومات أنظروا من الفصل 17،القسم 3 ، عن: تعريف وتحليل المشكلة.
التوقعات هي النتائج المقصودة بالبرنامج. وهي تشرح ما على البرنامج أن يحقق من أجل أن يعتبر ناجحاً. في معظم البرامج فإن الإنجازات تكون متتابعة (أولاً نحقق هذا... ثم نريد أن نفعل ذاك...). لذلك يجب أن ننظمها بحسب الزمن بحيث تنطلق من النتائج المرجوة المحددة (والفورية) إلى الواسعة (والأبعد مدى). مثلا، فإن رؤيا البرنامج رسالته وأهدافه العامة وأهدافه المباشرة كلها تمثل مستويات متنوعة من درجة تحديد التوقعات من البرنامج (أنظروا شرحها في الفصل 8،القسم 1: نظرة عامة على التخطيط الاستراتيجي: الرؤيا، الرسالة، الأهداف، الاستراتيجيات، خطة العمل).
الأنشطة هي كل شيء يفعله البرنامج من أجل إحداث تغييرات. إن وصف مكوّنات البرنامج وعناصره تسمح بإدراج الاستراتيجيات والأعمال المحددة في تسلسل منطقي. هذا يُظهر أيضاً كيف ترتبط أنشطة مختلفة في البرنامج أحدها بالآخر، كما في العلاقة بين التربية وبين إعمالها. وكذلك، يوفر وصف أنشطة البرنامج فرصة للتمييز بين الأنشطة التي هي من مسؤوليات البرنامج مباشرة وتلك التي تنفذها برامج أخرى أو منظمات شريكة. ويمكن هنا أيضاً ذكر أمور خارج البرنامج يمكن أن تؤثر في نجاحه كمثل قوانين أشد صرامة في معاقبة من يبيع السجائر أو الكحول تحت السن القانونية.
الموارد تشمل الوقت، والمواهب، والتجهيزات، والمعلومات، والمال والأرصدة الأخرى المتاحة لتنفيذ أنشطة البرنامج. ومراجعة الموارد التي يمتلكها البرنامج تنبئ بالكثير عن حجم وكثافة الخدمات. ويمكن أيضاً أن تشير إلى مواضيع فيها تباين بين ما تريد المجموعة أن تفعل وبين الموارد المتوافرة لتنفيذ هذه الأنشطة. إن فهم تكاليف البرنامج ضرورة لقياس المعادلة بين التكلفة والمنفعة عند التقييم.
مرحلة تطور البرنامج تعكس مدى نضجه. كل برامج الصحة والتنمية المجتمعية تنضج وتتغير مع الوقت. لذا على الأشخاص الذين يجرون التقييم وأولئك الذين يستخدمون نتائج التقييم أن يأخذوا في اعتبارهم الطبيعة الدينامية للبرامج. مثلاً، البرنامج الذي تلقى لتوه أول منحة قد يختلف في أوجه كثيرة عن برنامج يُنفذ منذ عقد من الزمن.

هناك ما لا يقل عن 3 مراحل منظورة من التطور: التخطيط، والتنفيذ والآثار أو النتائج. ففي مرحلة التخطيط تكون الأنشطة ما زالت غير مختبرة ويكون هدف التقييم هو أن يجعلها على أدق ما يمكن. وفي مرحلة التنفيذ يجري اختبار أنشطة البرنامج في الميدان وتعديلها – هنا يستهدف التقييم اكتشاف ما يحصل في "العالم الحقيقي" وأن يحسن عمليات التنفيذ. أما في مرحلة الآثار، فيكون قد مرّ من الوقت ما يكفي لظهور آثار البرنامج. هنا يستهدف التقييم تحديد نتائج البرنامج وفهمها، بما في ذلك تلك التي لم تكن مقصودة.

إن وصف سياق البرنامج - أو إطاره – يأخذ في اعتباره سِمات مهمة في البيئة التي يعمل فيها البرنامج. وهذا يشمل فهم تاريخ المنطقة وجغرافيتها والسياسات فيها وظروفها الاجتماعية والاقتصادية، وكذلك ما فعلته المنظمات الأخرى. والتقييم الواقعي والمتجاوب يكون حساساً إزاء تنوع واسع من المؤثرات المحتملة على البرنامج. إن فهم السياق يساعد المستخدِمين على تفسير نتائج التقييم بدقة وعلى تقدير مدى صلاحيتها للتعميم. مثلاً، إن برنامجاً لتحسين ظروف السكن في وسط مدينة قد يحقق نجاحاً كبيراً في حين أنه قد لا ينجح في بلدة صغيرة في منطقة أخرى من البلاد من دون تعديل كبير. أنظروا المزيد عن ذلك في من الفصل 19،القسم 4: تكييف التدخلات المجتمعية لتلائم ثقافات ومجتمعات محلية مختلفة.
النموذج المنطقي يدمج عناصر البرنامج الأساسية في صورة واحدة تُظهر كيف يُفترض بالبرنامج أن يشتغل. وهو يُظهر الأحداث التي يُفترض أنها ستُحدِث التغيير. كثيراً ما يُعرض المنطق في صورة رسم متدفق، أو خارطة أو جدول للتعبير عن تسلسل الخطوات التي تقود إلى نتائج البرنامج. من أجل مثال على نموذج منطقي لبناء القدرات على تغيير المجتمع المحلي والنظم (الذي طورته جامعة كانساس) أنظروا الفصل 1، القسم 3 عن نموذج الممارسة عندنا: بناء القدرات من أجل تغيير المجتمع المحلي والنظم.

إن تكوين نموذج منطقي يسمح لأصحاب المصلحة بتحسين اتجاه البرنامج وتركيزه. وهو يكشف الافتراضات الخاصة بشروط تحقيق فعالية البرنامج ويوفر إطاراً مرجعياً لإجراء تقييم أو أكثر للبرنامج. يستطيع نموذج منطقي مفصل أن يكون أيضاً أساساً لتقدير أثر البرنامج في نقاط نهائية لا يجري قياسها مباشرة. مثلاً، سيكون من الممكن تقدير معدل تراجع الأمراض من عدد معروف من الأشخاص الذين يشاركون في التدخل إذا كان هناك معرفة مسبقة عن فعاليته.

يتفاوت مدى وصف البرنامج بين تقييم برنامج وآخر. وهكذا يمكن أن تكون أنشطة كثيرة مختلفة جزءاً من تطوير ذلك الوصف. مثلا، يمكن استجماع مصادر عدة من المعلومات معاً من أجل إنشاء وصف متكامل. إن دقة وصف برنامج قائم يمكن تأكيدها من خلال نقاش مع أصحاب المصلحة. ويمكن التحقق من وصف ما يحدث باستعمال مراقبة الأنشطة في الميدان مباشرة. ويمكن توسيع وصفٍ ضيقٍ للبرنامج من خلال الاستعانة بعوامل نابعة من السياق (مثل وتيرة تبدل العاملين، أو عدم كفاية الموارد، أو الضغوط السياسية، أو مشاركة الناس بقوة)، أي العوامل التي قد تؤثر في أداء البرنامج. للمزيد من المعلومات، أنظروا الفصل 39، القسم 3 عن: تقديم معلومات التقييم إلى جمهور من المجتمع المحلي.

التركيز على تصميم التقييم

نعني بالتركيز على تصميم التقييم إنجاز تخطيط مسبق عن وجهة التقييم والخطوات التي يتطلبها للوصول هناك. إذ ليس من الممكن أو المفيد أن يحاول التقييم الإجابة عن كل أسئلة جميع أصحاب المصلحة: يجب أن توجد في التقييم نقطة تركيز، أو بؤرة. فالخطة المركزة تركيزاً جيداً تشكل ضمانة لعدم استخدام الوقت والموارد استخداماً غير مُجدٍ.

هناك أنواع مختلفة من التقييم واختيار أحدها يتوقف على ما تريدون أن تعلموه. ولكن، وفور بدء عملية جمع البيانات فقد يصبح من الصعب – أو حتى من المستحيل – تغيير ما تفعلون حتى ولو اتضح أن طرقاً أخرى يمكن أن تنجح أكثر. إن الخطة المحكمة يمكنها أن تتنبأ بالاستعمالات المقصودة وأن تخلق استراتيجية تقييم تمتلك أفضل حظٍ في أن تكون ناجحة، وممكنة، وملائمة، ودقيقة. والمسائل التي ينبغي مراعاتها هنا تشمل:

الغرض
المستخدمين
الاستخدامات
الأسئلة
الطرق
الاتفاقات

دعونا نلقي نظرة على كل واحدة منها.

الغرض يشير إلى النية في التقييم. فالغرض الواضح يخدم أساساً لتقييم التقييم، وطرقه، ومنفعته. إن أخذ الوقت الكافي لبلورة الغرض العام يمنع منظمتكم من أن تتخذ قرارات غير مدروسة في ما يتعلق بكيفية إجراء التقييم واستخدامه.

هناك أربعة أغراض عامة، على الأقل، يمكن أن تدفع مجموعة محلية إلى إجراء تقييم:

لاكتساب نظرة أعمق: هذا يمكن أن يحصل، مثلاً، عند تقرير ما إذا كان المطلوب استخدام نهج جديد (مثلاً، هل ينجح برنامج محلي لحراسة الحي؟). فالمعرفة الناتجة عن مثل هذا التقييم تزودنا معلوماتٍ عما إذا كان عملياً. ويمكن للمعلومات عن تقييم برامج أخرى مشابهة أن تزود برنامجاً قيد النشوء بالنظرة الأعمق اللازمة لتوضيح كيفية تصميم أنشطته.

تحسين طرق العمل: هذا الغرض يلائم مرحلة التطبيق حيث يحاول البرنامج أن يشرح ما فعله. ويمكن استخدام المعلومات لوصف عمليات البرنامج، وتحسين طرق عمل البرنامج، ولجعل الإستراتيجية العامة أكثر دقة. والتقييمات التي تجري لهذا الغرض تشمل الجهود لتحسين نوعية أنشطة البرنامج أو فعاليته أو كفاءته.

تحديد مفاعيل البرنامج: التقييمات هنا تتفحص العلاقة بين أنشطة البرنامج وعواقبه المنظورة. مثلاً، هل ازداد عدد الطلاب الذين ينهون الدراسة الثانوية نتيجةً للبرنامج؟ إن البرامج الأكثر ملاءمة لهذا النوع من التقييم هي برامج ناضجة قادرة على طرح ما حصل بوضوح ومَن كان المستهدف منه. ومثل هذه التقييمات عليها أن توفر دليلاً على مساهمة البرنامج في الوصول إلى أهداف عامة أبعد مدى من قبيل خفض حالات إساءة معاملة الأطفال أو الجريمة في المنطقة. ويساعد هذا النوع من التقييم على بناء المساءلة، وبذلك بناء صدقية البرنامج أمام الممولين والمجتمع المحلي.

للتأثير في أولئك المشاركين فيه: إن المنطق والتأمل المطلوبين من المشاركين في التقييم يمكن أن يكونا في حد ذاتهما محفزاً على تغيير في المشاركين أنفسهم. بذلك، يكون أحد أغراض برنامج التقييم أن تولد عمليته ونتائجه أثراً إيجابياً. مثل هذا الأثر يمكن أن يكون:

"تمكين" المشاركين في البرنامج (مثلاً، المشاركة في تقييمٍ ما يمكنها أن تزيد من شعور أفراد المجتمع المحلي بسلطتهم على البرنامج)
إكمال البرنامج (مثلاً، استخدام استبيان للمتابعة يمكنه أن يعيد تعزيز رسائل البرنامج الرئيسية)
تعزيز تطوير العاملين (مثلاً، من خلال تعليم الطاقم كيف يجمعون ويحللون ويفسرون الدليل)...
... أو المساهمة في النمو التنظيمي (مثلاً، يمكن التقييم أن يوضّح علاقة البرنامج برسالة المنظمة ودورها).

المستخدِمون هم الأشخاص المحدَدون الذين يتسلمون ما خرج به التقييم. وهم الذين سيختبرون مباشرةً عواقب المقايضات المحتومة في عملية التقييم. مثلاً، يمكن أن تكون إحدى المقايضات إجراء تقييم متواضع نسبياً بما يلائم الموازنة الأمر الذي يؤدي إلى نتائج مؤكدة بأقل مما لو كان التقييم شاملاً تماماً. من هنا يكون للمستخدِمين المستهدفين الحق في المشاركة في اختيار مجال تركيز التقييم لأنهم هم الذين سيتأثرون بنتائجه. إن تصميم التقييم من دون مشاركة ملائمة من قبل مستخدِميه في اختيار بؤرة تركيزه قد يتحول إلى تمرين منحرف وغير ذي صلة. بالمقابل، عندما يجري تشجيع المستخدِمين على توضيح استخدامات التقييم والأسئلة ذات الأولوية والطرق المفضلة فهذا على الأرجح يساعد على التركيز على الأمور التي ستحدد مضمون الخطوات في المستقبل وتؤثر فيها.

الاستخدامات تصف ما الذي سنفعله بما سنتعلمه من التقييم. هناك تشكيلة متنوعة من الاستخدامات المحتملة لتقييم البرنامج. عموماً، تتوزع الاستخدامات إلى الفئات الأربع الخاصة بالأغراض المذكورة أعلاه: اكتساب نظرة أعمق، تحسين طرق عمل الأشياء، تحديد مفاعيل البرنامج، والتأثير في المشاركين. القائمة التالية تقدم أمثلة على الاستخدامات في كل فئة.

بعض الأمثلة على استخدام التقييم

لاكتساب نظرة أعمق:

تقدير حاجات ورغبات أفراد المجتمع المحلي (أنظروا الفصل 3، القسم 7) عن إجراء مسوحات تقدير الحاجات.
تحديد العوائق أمام استخدام البرنامج
تعلم كيفية وصف وقياس أنشطة البرنامج على أفضل وجه.

تحسين طرق عمل الأشياء:

جعل الخطط الرامية إلى تقديم ممارسات جديدة أكثر دقة
تحديد مدى تطبيق الخطط
تحسين المواد التثقيفية
تعزيز القدرة الثقافية (أنظروا الفصل، 19 القسم 14عن: تكييف التدخلات لملاءمة ثقافات ومجتمعات محلية مختلفة)
التأكد من صيانة حقوق المشاركين
وضع أولويات تدريب العاملين (انظروا الفصل، 10 القسم عن: تطوير برامج تدريب للعاملين)
إجراء تعديلات في منتصف الدورة
توضيح الاتصال
تحديد ما إذا كان رضى العميل قد تحسن
مقارنة الكلفة إلى المنفعة
استكشاف المشاركين الأكثر انتفاعاً من البرنامج
تعبئة الدعم من المجتمع المحلي للبرنامج (أنظروا الفصل 46، القسم 4 عن: جذب الدعم لبرامج محددة).

تحديد مفاعيل البرنامج:

مقياس النمو في مهارات المشاركين في البرنامج
مقارنة التغيرات في السلوك مع مرور الوقت
تقرير أين ستخصص الموارد الجديدة
توثيق مستوى النجاح في تحقيق الأهداف (أنظروا الفصل 38، القسم 1 عن: قياس النجاح: تقييم مبادرات شاملة في صحة المجتمع المحلي)
إظهار أن متطلبات المساءلة قد جرى تلبيتها
استخدام المعلومات من تقييمات متعددة للتنبؤ بالمفاعيل المحتملة لبرامج متشابهة.

للتأثير في المشاركين:

إعادة تعزيز رسائل البرنامج
تنشيط الحوار وزيادة الوعي بقضايا الناس
توسيع الإجماع بين الشركاء على أهداف البرنامج العامة
تعليم العاملين وأصحاب المصلحة الآخرين مهارات التقييم
جمع قصص نجاح
دعم التغيير والتحسين في المنظمة

بعد ذلك، يكون على التقييم أن يجيب عن أسئلة محددة. وصياغة الأسئلة تشجع أصحاب المصلحة على كشف ما يعتقدون ما يجب على التقييم تلبيته، أي ما هي الأسئلة الأهم عند أصحاب المصلحة المراهنين على البرنامج؟ إن عملية التقييم تساعد على تركيز التقييم تركيزاً أكثر دقة.

الطرائق المتاحة لإجراء التقييم تُستمد من علم السلوك والبحث الاجتماعي والتنمية الاجتماعية. وهناك ثلاثة أنواع من الطرائق المعتمدة بشكل عام، وهي: الاختبارية، وشبه الاختبارية وتلك القائمة على الملاحظة.

إن تصاميم الطرائق الاختبارية تستخدم اختيارات عشوائية لمقارنة مفعول التدخل ما بين مجموعات متماثلة في العادة (مثلاً، مقارنة مجموعة طلاب مختارة عشوائياً شاركت في برنامج للقراءة بعد المدرسة بمجموعة طلاب لم تشارك).
أما الطرائق شبه الاختبارية فتعقد مقارنات بين مجموعات غير متكافئة (مثلاً، بين المشاركين في البرنامج وأولئك في لائحة الانتظار) أو أنها تستخدم مقارنات ضمن مجموعة على مدى فترة من الزمن، كما في مسلسل متقطع زمنياً يمكن فيه إدخال تدخل تتابعي على أفراد مختلفين أو مجموعات أو سياقات مختلفة.
أما الطرائق القائمة على الملاحظة أو على دراسات الحالة فهي تستخدم مقارنات ضمن المجموعة لوصف وشرح ما يحدث (مثلاً، دراسات حالة مقارنة في مجتمعات محلية متعددة).

إن أياً من الطرائق الثلاث ليست أفضل من غيرها. فطرائق التقييم يجب اختيارها بسبب ما توفره من معلومات ملائمة للرد على أسئلة أصحاب الرهان أو المصلحة وليس بسببٍ من كونها مألوفة أو سهلة أو محبوبة. إن للاختيار عواقب تتعلق بما يمكن أن يُحتسب دليلاً وكيف سيُجمع هذا الدليل وما هي المطالب التي ستعلن. وحيث أن خيار كل طريقة له انحيازاته وحدوده فإن التقييمات التي تخلط الطرائق هي أكثر متانة.

الطرائق قد تحتاج إلى مراجعة أو تعديل على امتداد عملية التقييم. فالظروف التي تجعل مقاربة معينة نافعة يمكن أن تتبدل. مثلاً، إن الاستخدام المقصود بالتقييم يمكن أن ينحرف من كيفية تحسين البرنامج ليصبح كيفية المساعدة على تحديد ما إذا كان البرنامج يجب أن يستمر أم لا. لذلك، فالطرائق قد تحتاج إلى تكييف أو إعادة تصميم من أجل إبقاء التقييم في مساره.

الاتفاقات تلخص إجراءات التقييم وتوضح دور كل شخص ومسؤولياته. فالاتفاق يصف كيف ستنفذ أنشطة التقييم. وتشمل عناصر الاتفاق بيانات عن الغرض المقصود، والمستخدمين، والاستخدامات، والطرائق كما يتضمن ملخصاً عن منتّجات التقييم، والمسؤوليات، وجدول تنفيذ زمني وموازنة.

وتتوقف درجة "رسمية" الاتفاق على العلاقات القائمة بين المعنيين به. مثلاً، الاتفاق قد يتخذ شكل عقد قانوني، أو بروتوكولاً أو محضراً مفصلاً أو مذكرة تفاهم بسيطة. ولكن، بغض النظر عن درجة رسميته فإن اتفاقاً صريحاً يوفر فرصة لتأكيد التفاهم المتبادل اللازم من أجل تقييم ناجح. وهو يوفر أيضاً أساساً لإجراءات التعديل إذا ما اتضح ضرورتها.

كما ترون، فإن تركيز تصميم التقييم يمكن أن يشمل أنشطة كبيرة. على سبيل المثال، فإن كلاً من مؤيدي البرنامج والمتشككين يمكن استشارتهم لضمان أن تكون أسئلة التقييم واردة من الناحية السياسية. يمكن توزيع قائمة تضم استخدامات التقييم الممكنة والملائمة لمرحلة تطور البرنامج على أصحاب المصلحة من أجل تحديد أيها الأكثر إلحاحاً. ويمكن إجراء مقابلات مع بعض المستخدِمين على وجه التحديد من أجل أن نفهم فهماً أفضل حاجاتهم من المعلومات وجدول العمل الزمني. ويمكن اختزال المتطلبات من الموارد عندما يكون المستخدمون على استعداد لتوظيف طرائق تقييم ملائمة من ناحية التوقيت ولكنها أقل دقة.

جمع دليل صادق

الدليل الصادق هو المادة الخام للتقييم الجيد. فالمعلومات التي تجمع يجب أن تكون قابلة للتصديق والوثوق بها من قبل أصحاب المصلحة، وذات صلة من أجل أن تجيب عن أسئلتهم. إن هذا يتطلب تفكيراً واسعاً في ما يمكن احتسابه "دليلاً". مثل هذه القرارات يعتمد دائماً على الوضع المحدد، ويتوقف على السؤال المطروح وعلى ما يحفز على طرحه. فبالنسبة لبعض الأسئلة، فإن معيار الصدقية عند بعض أصحاب المصلحة قد يتطلب وجود نتائج اختبار عشوائي. فيما قد يتطلب توفير الصدقية لسؤال آخر وجود طقم من الملاحظات المشغولة جيداً والمنتظمة كما في التفاعلات ما بين عامل مع المجتمع المحلي وسكانه. ويتوقف الفرق على نوع المعلومات التي يريدها أصحاب المصلحة والوضع الذي تجمع فيه.

السياق مهم! ففي بعض الأوضاع قد يكون من الضروري استشارة خبراء في التقييم. وقد يصح هذا على وجه الخصوص حين يكون الحرص على نوعية البيانات عالياً جداً. وفي أوضاع أخرى، قد يوفر الناس المحليون أعمق النظرات. إلا أنه وبغض النظر عن خبراتهم فإن على الأشخاص المنخرطين في تقييمٍ ما أن يبذلوا جهودهم في جمع معلومات ترسم صورة صادقة ومكتملة عن البرنامج وجهوده.

إن وجود دليل صادق يقوّي نتائج التقييم وكذلك التوصيات النابعة منها. وعلى الرغم من أن لكل أنواع البيانات حدوداً فإن من الممكن تحسين صدقية التقييم العامة. وتتمثل إحدى أساليب تحقيق ذلك في استخدام إجراءات متعددة في جمع البيانات وتحليلها وتفسيرها. كذلك فإن تشجيع أصحاب المصلحة على المشاركة يمكن أن يعزز الصدقية المنشورة. فحين يساعد أصحاب المصلحة على تحديد الأسئلة وجمع البيانات فالأرجح أن يتقبلوا استنتاجات التقييم والتحرك لتنفيذ توصياته.

ما يلي من سمات جمع الأدلة تؤثر، نموذجياً، على مدى صدقية جمع البيانات في أن يكون:

مؤشرات
مصادر
نوعية
كمية
لوجستيات (عملانيات)

دعونا ننظر إليها واحدة بعد أخرى.

المؤشرات تترجم المفاهيم العامة الخاصة بالبرنامج، ومفاعيله المتوقعة، إلى أجزاء محددة وقابلة للقياس. الأمثلة على المؤشرات تشمل:

قدرة البرنامج على توفير الخدمات
معدل المشاركة
مستوى رضى العملاء
مستوى التعرض للتدخل (كم عدد الأشخاص الذين جرى تعريضهم للبرنامج ومدة التعرض)
التغيرات في سلوك المشاركين
التغيرات في ظروف أو معايير المجتمع المحلي
التغيرات في البيئة المحيطة (مثلاً، برامج أو سياسات أو ممارسات جديدة)
تغيرات طويلة الأمد في حال صحة السكان (مثلاً، معدّل حمل المراهقات في البلد).

على المؤشرات أن تخاطب المعايير التي ستستخدم في الحكم على البرنامج. أي أن المؤشرات تعكس أوجه البرنامج التي تشكل مراقبتها أكثر أهمية. ويحتاج الأمر في العادة إلى عدة مؤشرات من أجل متابعة تطبيق أو مفاعيل برنامج أو تدخل مركب.

إن إحدى طرائق تطوير مؤشرات متعددة هي في خلق "بطاقة نتائج متوازنة" تحتوي مؤشرات جرى اختيارها بعناية بحيث يكمل أحدها الآخر. تبعاً لهذه الإستراتيجية يمكن النظر إلى عمليات البرنامج ومفاعيله من زوايا متعددة باستعمال مجموعات صغيرة من المؤشرات ذات الصلة. على سبيل المثال، يمكن أن تشمل "بطاقة نتائج متوازنة" لبرنامج وحيد مؤشرات على كيفية توصيل البرنامج إلى الناس، وعلى رأي المشاركين في البرنامج، وعلى المفاعيل المنظورة، وعلى الأهداف التي تحققت، وعلى التغيرات التي تحدث في البيئة المحيطة بالبرنامج.

المقاربة الأخرى في استخدام المؤشرات المتعددة تُبنى على نموذج منطقي للبرنامج كما ناقشناه في ما سبق من هذا القسم. ويمكن استخدام النموذج المنطقي بوصفه "قالباً" يحدد نطاقاً كاملاً من المؤشرات على امتداد الممر الذي يقود من أنشطة البرنامج إلى المفاعيل المتوقعة. ويمكن تطوير مؤشرات نوعية و/أو كمية لكل خطوة في النموذج.

المؤشرات يمكن أن تقوم على قاعدة عريضة وليست بحاجة إلى التركيز على أغراض البرنامج بعيدة المدى فحسب. إذ يمكنها أن تخاطب أيضاً عوامل وسطى تؤثر على فعالية البرنامج بما في ذلك عوامل غير ملموسة كمثل جودة الخدمة أو مقدرة المجتمع المحلي أو العلاقات داخل المنظمة. ويمكن خلق مؤشرات لهذه المفاهيم ولأمثالها من خلال التحديد المنتظم لعلاماتٍ دالّة على ما يقال ويُفعل عند التعبير عن المفهوم، وتتبّع هذه العلامات.

في مجرى التقييم، قد تنشأ الحاجة إلى تعديل المؤشرات أو تبنّي مؤشرات جديدة. كذلك، فإن قياس أداء البرنامج من خلال تتبع المؤشرات لهو مجرد جزء من التقييم وينبغي عدم بلبلته كأساس لاتخاذ القرارات في حد ذاته. فهناك مخاطر محددة تنجم عن استخدام مؤشرات الأداء بديلاً من إكمال عملية التقييم والتوصل إلى استنتاجات مبررة بالكامل. مثلاً، فإن مؤشراً من نوع ارتفاع معدل البطالة قد يقود إلى الافتراض الخاطئ بأنه يعكس فشل البرنامج في حين أن المعدّل يمكن أن يعود في الواقع إلى ظروف بيئية متغيرة تخرج عن سيطرة البرنامج. انظروا القسم 1 من الفصل 38 عن: قياس النجاح: تقييم مبادرات صحية محلية متكاملة.

مصادر الدليل في التقييم يمكن أن تكون أشخاصاً أو وثائق أو مشاهدات. ويمكن استخدام أكثر من مصدر واحد لجمع دليل لكل مؤشر. في الواقع، فإن اختيار مصادر متعددة يوفر فرصة لتغطية منظورات مختلفة عن البرنامج وتعزيز مصداقية التقييم. مثلاً، فإن منظوراً داخلياً قد تعكسه وثائق داخلية والتزامات من العاملين أو مدير البرنامج، في حين أن العملاء وأولئك الذين لا يدعمون البرنامج قد يقدموا منظورات مختلفة لا تقل في صلتها بالبرنامج. إن خلط هذه المنظورات وغيرها يوفر نظرة أشمل على البرنامج أو التدخل.

المعايير المستخدمة في اختيار المصادر ينبغي أن يكون النص عليها واضحاً بحيث يتمكن المستخدمون وأصحاب المصلحة من تفسير الدليل بدقة وتقدير ما إذا كان منحازاً. فضلاً عن ذلك، فبعض المصادر تقدم معلومات على شكل سردي (مثلاً، في شكل خبرة شخص عند مشاركته في البرنامج)، وأشكال أخرى رقمية (مثلاً، عدد الأشخاص المنخرطين في البرنامج). ودمج المعلومات النوعية والكمية يمكن أن يُنتج دليلاً أكثر اكتمالاً وأكثر نفعاً ما يلبي حاجات وتوقعات تنوعاً أوسع من أصحاب المصلحة.

الجودة تشير إلى مدى ملاءمة المعلومات المجموعة وتكاملها في التقييم. فالبيانات ذات النوعية العالية يمكن الاعتماد عليها وهي توفر معلومات أكثر. من الأسهل جمع المعلومات حين تكون المؤشرات معرّفة تعريفاً جيداً. والعوامل الأخرى التي توثر في النوعية يمكن أن تشمل تصميم الأداة، وإجراءات جمع البيانات وتدريب المشاركين في جمع البيانات، واختيار المصادر، والترميز (كُودنْغ) وإدارة البيانات وكذلك تدقيق الأخطاء الروتيني. إن الحصول على بيانات نوعية يتضمن مقايضات (مثلاً، التوسع مقابل التعمق) وعلى أصحاب المصلحة أن يقرروا معاً ما هو الأهم عندهم. ولأن لكل البيانات حدوداً فإن نية إجراء تقييم عملي هي السعي نحو مستوى من الجودة يلبي مستوى المصداقية الذي يرغبه أصحاب المصلحة.

الكمية تشير إلى حجم الدليل الذي جُمع في التقييم. ومن الضروري أن نقدّر مسبقاً حجم المعلومات اللازمة لإقامة معايير لنقرر متى نتوقف عن جمع البيانات، أي أن نعرف متى يكفي ما جُمع. والكمية تؤثر في مستوى الثقة أو الدقة عند المستخدمين – أي إلى أي مدى يمكننا أن نتأكد من أن ما تعلمناه حقيقي. وتقرر الكمية أيضاً ما إذا كان التقييم سيكون قادراً على استشعار المفاعيل. إن كل الأدلة المجموعة ينبغي أن يكون لها استخدام واضح ومتوقع.

اللوجستيات (العملانيات) هي الطرائق والتوقيت والبنية التحتية المادية اللازمة لجمع الدليل والتعامل معه. إن للناس، والمنظمات كذلك، أفضليات ثقافية تقرر الطرائق المقبولة في طرح الأسئلة وجمع المعلومات، بما في ذلك تقرير من الذي يُعتبر شخصاً مناسباً لطرح الأسئلة. مثلا، قد يكون بعض المشاركين على استعداد لمناقشة سلوكهم مع شخص غريب فيما يرتاح آخرون إلى شخص يعرفونه. لذلك يجب أن تتناسب تقنيات جمع الأدلة في التقييم مع المعايير الثقافية عند المجتمع المحلي. إن على إجراءات جمع البيانات أن تضمن الكتمان وسرية المعلومات.

تبرير الاستنتاجات

تدرك عملية تبرير الاستنتاجات أن الأدلة في التقييم لا تتحدث بالضرورة عن نفسها. فالدليل يجب أن يُدرس بعناية من منظور عدد من أصحاب المصلحة(؟) للتوصل إلى استنتاجات مبررة ومدعومة جيداً. ويمكن تبرير الاستنتاجات حين تُربط بالدليل المجموع وتقاس بمجموعة القيم التي اتفق عليها أصحاب المصلحة(؟). وهؤلاء يجب أن يتفقوا على استنتاجات مبررة حتى يستعملوا التقييم بثقة.

هناك خمسة عناصر رئيسية في تبرير الاستنتاجات المبنية على دليل:

المعايير القياسية
التحليل والتركيب
التفسير
الحكم
التوصيات

دعونا ننظر فيها واحداُ بعد آخر.

المعايير القياسية (سْتاندَرد) تعكس القيم التي يحملها أصحاب المصلحة عن البرنامج. إن استخدام معايير قياسية صريحة في الحكم هو أساسي في أي تقييم رصين. في الممارسة، وعندما يحدد أصحاب المصلحة قيمهم بدقة ويتفاوضون حولها تصبح هذه هي المعايير القياسية في الحكم على ما إذا كان أداء برنامج معين سيعتبر "ناجحا" أو "كافياً" أو "غير ناجح"، على سبيل المثال.

التحليل والتركيب هما طريقتان لاكتشاف وتلخيص نتائج التقييم. والغرض منهما هو اكتشاف الأنماط في الدليل إما بعزل النتائج المهمة (التحليل) أو بتجميع مصادر مختلفة من المعلومات للوصول إلى فهم أوسع (التركيب). ويتطلب التقييم القائم على طرائق مختلطة تحليل كل عنصر في الدليل على حدة كما يتطلب تركيبة من كل المصادر لتفحص الأنماط المستخرجة. إن فك الرموز وتوضيح الوقائع في جسم الدلائل يتطلب أن نتخذ قراراً حول كيفية تنظيم المعلومات، وتصنيفها، ومقارنتها وعرضها. وهذه القرارات تسترشد بالأسئلة المطروحة، وأنواع البيانات المتاحة، وخصوصاً بما يقدمه أصحاب المصلحة والمستخدِمون الأساسيون المستهدَفون.

التفسير هو الجهد اللازم لإدراك ما تعنيه نتائج التقييم. فالكشف عن حقيقة أداء البرنامج لا يكفي للتوصل إلى استنتاجات. الحقائق يجب أن تُفسّر حتى نفهم مغزاها العملي. مثلاً، إن القول "إن 15% من الناس في منطقتنا قد شهدوا عملاً عنيفاً في العام الماضي" قد يُفسر تفسيرات مختلفة بحكم الوضع. مثلاً، إذا كان 50% من أفراد المجتمع المحلي شهدوا عملاً عنيفاً في العام الماضي عندما استُجوبوا قبل 5 سنوات، فقد تستنتج المجموعة أن الأمور تتحسن رغم إن المشكلة ما زالت قائمة. أما إذا كان 7% فقط من المستجوبين قبل 5 سنوات قد قالوا الشيء نفسه فقد ترى المنظمات المحلية في ذلك علامة على الحاجة إلى تغيير ما يقومون به. باختصار، تتوقف التفسيرات على المعلومات وزوايا النظر التي يجلبها أصحاب المصلحة إلى التقييم. ويمكن تقوية التفسيرات بفعل المشاركة النشطة أو التفاعل مع البيانات والشروحات الأولية لما حدث.

الأحكام هي إفادات عن حسنات وقيمة وأهمية البرنامج. وهي تتشكل من مقارنة نتائج التقييم وتفسيراته بواحد أو أكثر من معايير قياسية مختارة. وحيث أن المعايير القياسية يمكن تطبيقها على برنامج معين فقد يتوصل أصحاب المصلحة إلى أحكام متباينة أو حتى متعاكسة. مثلاً، إن برنامجاً يزيد من توسعه بنسبة 10% قياساً بالعام الماضي يمكن أن يحكم عليه مدراء البرنامج إيجاباً بناءً على معايير قياسية خاصة بتحسن الأداء مع مرور الوقت. أما أعضاء المجتمع المحلي فقد يشعرون أنه رغم التحسن فالبرنامج لم يتمكن بعد من تخطي عتبة دنيا من التوسع والوصول. إن حكمهم المبنى على مقاييس الإنصاف الاجتماعي سيكون بذلك سلبياً. إن الإدعاءات المتضاربة عن نوعية وقيمة وأهمية البرنامج كثيراً ما تشير إلى أن أصحاب المصلحة يستعملون معايير قياسية أو قيماً في إصدار الأحكام. هذا النوع من الاختلافات يمكن أن يكون محفّزاً على توضيح القيم والتوصل إلى الأساس (أو الأسس) التي ينبغي استخدامها في الحكم على البرنامج.

التوصيات هي أعمال قيد النظر كنتيجة للتقييم. وتشكيل التوصيات يتطلب معلومات تتجاوز ما يلزم لصياغة أحكام. مثلاً، إن معرفة أن البرنامج قادر على زيادة الخدمات المتاحة للنساء المعتدى عليهن لا يُترجم بالضرورة إلى توصية بمواصلة الجهد، خصوصاً حين توجد أولويات متنافسة أو بدائل فعالة أخرى. بذلك، فإن التوصيات بما يجب عمله تذهب بتدخل معين إلى أبعد من الأحكام الخاصة بفعالية برنامج محدد.

إن صدقية التقييم يمكن أن تتزعزع ما لم تكن التوصيات مُستندة إلى أدلة كافية أو ما لم تكن منسجمة مع قيم أصحاب المصلحة. بالمقابل، يمكن تقوية التقييم بتوصيات تستبق ما يريد مستخدمو التقييم معرفته وتستجيب له. ثلاثة أمور يمكنها أن تزيد من فرص التوصيات في أن تكون ذات صلة وأن تُستقبل استقبالاً طيباً:

تَشارك مسودة التوصيات
استدراج ردود فعل من أصحاب مصلحة متعددين
تقديم خيارات بدلاً من نصائح توجيهية.

إن تبرير الاستنتاجات في تقييمٍ ما هو عملية، سيورة تتضمن خطوات ممكنة مختلفة. مثلاً، يمكن تقوية الاستنتاجات من خلال البحث عن تفسيرات بديلة من تلك التي اخترتموها ثم تَبيان لماذا هي مدعومة بالأدلة. إذ حين تكون هناك استنتاجات مختلفة ولكنها مدعومة دعماً متساوياً يصبح من الممكن تقديم كلٍّ منها مصحوباً بملخص عن نقاط قوته وضعفه. ويمكن الاتفاق قبل بدء جمع البيانات على تقنيات تحليل وتركيب وتفسير النتائج.

ضمان استخدام وتشارك الدروس المستخلصة

من السذاجة الافتراض بأن الدروس المستخلصة في التقييم سيجري استخدامها في اتخاذ القرارات والخطوات العملية التالية. على المقيّيمين بذل جهد مقصود لضمان أن تستخدم النتائج على وجه مناسب. ويتضمن التحضير لاستخدامها تفكيراً استراتيجياً وتيقظاً عند البحث عن فرص للتواصل والتأثير، وهما أمران ينبغي أن يبدأ في المراحل المبكرة في العملية وأن يستمرا عبر التقييم كله. هناك خمسة عناصر ذات أهمية رئيسية لضمان استخدام توصيات التقييم:

التصميم:
التحضير
المردود من الناس (إرجاع الأثر)
المتابعة
النشر والتعميم

دعونا نلقي نظرة على هذه العناصر واحداً بعد آخر.

التصميم يشير إلى كيفية بناء أو صياغة أسئلة التقييم، وطرقه والعمليات العامة. وبحسب ما ناقشنا في الخطوة الثالثة من خطوات إطار العمل هذا (تركيز تصميم التقييم) ينبغي تنظيم التقييم منذ البداية بحيث يحقق استخدامات محددة ومتفق عليها. فوجود غرض واضح يركز على استخدام ما جرى تعلمه يساعد أولئك الذين سينفذون التقييم على معرفة مَن سيفعل ماذا بالنتائج. فضلاً عن ذلك، فإن عملية خلق تصميم واضح سيبرز الطرائق التي تساعد أصحاب المصلحة على تحسين التقييم وتسهيل استخدام تنائجه بفضل مساهماتهم الكثيرة.
التحضير يشير إلى أن الخطوات المتخذة للاستعداد لاستخدام نتائج التقييم في المستقبل. فالقدرة على ترجمة المعرفة الجديدة إلى تحرك مناسب هي مهارة يمكن تقويتها عبر الممارسة. في الواقع، إن بناء هذه المهارة يمكن في حد ذاته أن ينفع التقييم، إذ من الممكن إعداد أصحاب المصلحة لاستخدام النتائج في المستقبل حين تجري مناقشة النتائج المحتملة التي قد تؤثر في اتخاذ القرارات.

على سبيل المثال، يمكن إعطاء المستخدِمين الرئيسيين وغيرهم من أصحاب المصلحة مجموعة من النتائج الافتراضية والطلب منهم تحديد قرارات أو تحركات بناءً على المعرفة الجديدة. فإذا ما أشاروا إلى أن الدليل المطروح غير كامل أو خارج الموضوع وأنه لن تتخذ أي خطوات فهذا يشكل إنذاراً مبكراً بضرورة تعديل خطة التقييم. كذلك، فالتحضير لاستخدام النتائج يعطي أصحاب المصلحة مزيداً من الوقت لاستكشاف كل من العواقب الإيجابية والسلبية الناجمة عن النتائج المحتملة واقتراح خيارات أخرى لتحسين البرنامج.

المردود، أو إرجاع الأثر، هو فعل التواصل الذي يحدث بين كل واحد من المشاركين في التقييم. إن إعطاء مردود إلى الآخرين أو تلقي مردود منهم يُلحقان مناخاً من الثقة بين أصحاب المصلحة. هذه العملية تحفظ التقييم على سكته حين تبقي كل مشارك على علم بما يحققه التقييم من تقدم. إن للمستخدِمين الرئيسيين ولغيرهم من أصحاب المصلحة الحق في التعليق على قرارات التقييم. فمن زاوية ضمان الاستخدام، يشكل المردود الصادر عن أصحاب المصلحة جزءاً ضرورياً من كل خطوة في التقييم. ويمكن التشجيع على الحصول على مردود ذي قيمة من خلال تنظيم مناقشات في كل خطوة من خطوات التقييم والتشارك الروتيني للنتائج المرحلية، والتفسيرات المؤقتة ومسودات التقارير. للمزيد، أنظروا الفصل 39، القسم 2 عن توفير المردود لتحسين المبادرة.
المتابعة تشير إلى الدعم الذي يحتاج إليه الكثير من مستخدمي التقييم بعد أن يتسلموا النتائج. وبسبب من حجم الجهود اللازمة فإن التوصل إلى استنتاجات مبررة قد يبدو وكأنه هدف في حد ذاته. لكنه ليس كذلك. إن المتابعة قد تكون ضرورية لكي تذكّرنا بالاستخدامات المقصودة لما تعلمنا. والمتابعة قد تكون مطلوبة أيضاً لمنع الدروس المستفادة من أن تضيع أو يجري تجاهلها في أثناء عملية اتخاذ قرارات مركّبة أو سياسية. لمنع هذه الهفوة قد يفيد أن نطلب من أحد المشاركين في التقييم أن يلعب دور المدافع عن نتائج التقييم في مرحلة اتخاذ القرارات.

تسهيل استخدام نتائج التقييم يحمل معه أيضاً المسؤولية عن منع إساءة الاستخدام. فنتائج التقييم محددة دائماً بالسياق الذي جرى فيه التقييم. إلا أن بعض أصحاب المصلحة قد يميل إلى انتزاع النتائج خارج سياقها من أجل استخدامها لأغراض تختلف عن تلك التي قُصدت لها. مثلاً، إن التعميم الزائد لنتائج دراسة حالة واحدة وصنع قرارات تؤثر في كل المواقع في برنامج وطني لهو مثال على سوء استخدام تقييم حالةٍ ما.

وعلى وجه مماثل، فإن خصوم البرنامج قد يسيؤون استخدام النتائج حتى انهم يبالغون في التركيز على النتائج السلبية من دون اعتبار ملائم للجوانب التي نجحت. والمتابعة النشطة يمكنها أن تساعد على تجنب هذه وتلك الأشكال من إساءة الاستخدام من خلال ضمان أن يُطبق الدليل على الأسئلة التي كانت محور التقييم المركزي وحدها.

النشر هو عملية التواصل التي تنقل الإجراءات أو الدروس المستفادة من التقييم إلى جمهورٍ معني بأسلوب ملائم زمنياً وغير منحاز، ومتسق. وكغيره من عناصر التقييم، ينبغي مناقشة استراتيجية التبليغ مسبقاً مع المستخدِمين المستهدَفين وأصحاب المصلحة الآخرين.. ويتطلب التخطيط لتواصلٍ فعالٍ مراعاةَ التوقيت والأسلوب والنبرة ومصدر الرسالة وأداة منتجات المعلومات وقالبها. وبغض النظر عن كيفية إنشاء التواصل فالهدف من النشر هو إنجاز كشف كامل وتبليغ غير منحاز. للمزيد أنظروا الفصل 39، القسم 3 عن: تقديم معلومات التقييم إلى جمهور محلي.

بالتزامن مع استخدامات نتائج التقييم هناك استخدامات أخرى تنساب من قلب عملية التقييم في حد ذاتها. إن "استخدامات العملية" تلك ينبغي تشجيعها. فالناس الذين يشاركون في التقييم يمكن أن يختبروا تغييرات ملموسة في معتقداتهم وتصرفاتهم. على سبيل المثال، يمكن التقييم أن يتحدى طاقم العاملين على أن يتصرفوا تصرفاً مختلفاً في ما يقومون به وأن يشككوا في الفرضيات التي تربط أنشطة البرنامج بالمفاعيل المنشودة.

كذلك فإن التقييم يحفز العاملين على توضيح فهمهم أهداف البرنامج. وزيادة الوضوح تساعد العاملين، بدورها، على أداء أفضل كفريق يركز على الهدف النهائي. باختصارـ فإن الإنغماس في منطق التقييم ومبرراته وقيمه يمكن أن يولّد مفاعيل إيجابية من قَبيل بناء القرارات على أحكام منتظمة بدلاً من افتراضات لا أساس لها.

الاستخدامات الإضافية لعملية التقييم تشمل:

تحديد المؤشرات يوضح المسائل التي تهم أصحاب المصلحة فعلاً
المساعدة على إعطاء أهمية للنتائج من خلال إعادة التشديد على تحقيق نتائج إيجابية. مثلاً، قد يعرض أحد الممولين "منحاً إضافية" أو "أرباحاًُ على النتائج " إذا ما أظهر البرنامج قدراً ملموساً من التغير أو التحسن عند المجتمع المحلي.

أنظروا "الأداة 2" للحصول على "قائمة مراجعة" عن ضمان النوعية والفعالية في تقارير التقييم المستخدمة في النشر.

معايير قياسية في التقييم "الجيد"

هناك معايير معتمدة لقياس ما إذا كانت أجزاء التقييم حسنة التصميم وشغّالة على أفضل ما يمكن. لهذا الغرض طوّرت "اللجنة المشتركة للتقييم التربوي" "المعايير القياسية لتقييم البرامج". وقد صُممت هذه المعايير لقياس عمليات التقييم في البرامج التربوية وهي صالحة أيضاً للبرامج والتدخلات المرتبطة بصحة وتنمية المجتمع المحلي.

تساعد المعايير القياسية في تقييم البرامج على إضفاء طابع عملي على إجراء تقييمات سليمة ومنصفة. فهي توفر مبادئ مدعّمة تماماً يمكن أتّباعها عند مواجهة حالات تتطلب مقايضة أو مساومة. والتزام هذه المعايير يمكن أن يحمي من إجراء تقييم غير متوازن كما في تقييم دقيقٍ ومجدٍ ولكنه غير مفيد تماماً وغير حساس في السياق المعين. والمثال الآخر على التقييم غير المتوازن هو ذاك الذي يكون مفيداً للغاية فيما تنفيذه مستحيل.

المعايير القياسية التالية يمكن تطبيقها في أثناء تطوير تصميم للتقييم وعلى امتداد مسار تطبيقه. تذكروا أن المعايير هذه مكتوبة بوصفها مبادئ إرشادية لا قواعد جامدة ملزمة في كل الظروف.

المعايير القياسية الثلاثون الأكثر تحديداً تتوزع على:

المنفعة (صلاحية الاستخدام)
الجدوى
الملاءمة
الدقة

دعونا نلقي نظرة على المعايير هذه واحداً بعد الآخر:

معايير المنفعة:

تستعمل هذه المعايير للتأكد من أن التقييم مفيد بحق، أي أنه يجيب عن أسئلة المستخدِمين النهائيين (وحاجاتهم). معايير المنفعة القياسية السبعة هي:

تحديد أصحاب المصلحة: يجب تحديد الناس المعنيين والمشاركين في التقييم (أو المتأثرين به) حتى يجري استجابة حاجاتهم.
مصدقية المقيّم: الأشخاص الذين يقومون بالتقييم عليهم أن يكونوا موثوقين وكفوئين بحيث يجري قبولهم – عموماً – على أنهم يتمتعون بالثقة والصدقية.
نطاق المعلومات والاختيار: يجب أن تغطي المعلومات المجموعة أسئلةً عن البرنامج تكون في محلها وأن تستجيب حاجات ومصالح العملاء وأصحاب مصلحة محدَّدين.
تحديد القيم: إن المنظور والإجراءات والمبررات المنطقية المستخدمة في تفسير نتائج التقييم يجب أن يجري وصفها بعناية بحيث تكون أساساً واضحاً للحكم على منافع وقيمة البرنامج.
وضوح التقرير: على تقارير التقييم أن تشرح بوضوح البرنامج موضع التقييم بما في ذلك سياق التقييم والغرض منه والإجراءات والنتائج. إن هذا سيساعد على ضمان أن تكون المعلومات المقدمة جوهرية وسهلة الفهم.
الجدول الزمني والنشر: إن نتائج التقييم في منتصف دورة البرنامج يجب أن يجري تشاركها مع المستخدِمين المستهدَفين حتى تُستعمل في الوقت والشكل المناسبين.
أثر التقييم: يجب أن يجري تخطيط التقييم وتنفيذه والتبليغ عن نتائجه بطرق تشجع أصحاب المصلحة على أن يتابعوا حتى النهاية بحيث يُستخدم التقييم.

معايير الجدوى القياسية:

وظيفة هذه المعايير هي ضمان أن يكون التقييم معقولاً، أي أن الخطوات التي جرى تخطيطها هي عملية وصالحة. المعايير هنا هي:

إجراءات عملية: إجراءات التقييم يجب أن تكون عملية، وأن تُبقي التقطع في الأنشطة اليومية في أثناء جمع المعلومات ضمن حدٍ أدنى.
الصلاحية السياسية: ينبغي التخطيط للتقييم وتنفيذه مع مراعاة مسبقة لمواقف المجموعات المختلفة ومصالحها. هذا يساعد في الحصول على تعاونها بحيث يجري تجنب المحاولات المحتملة لإحباط عمليات التقييم أو لإساءة استخدام نتائجه، أو للرد عليها.
جدوى الكلفة: على التقييم أن يكون فعّالاً وأن ينتج ما يكفي من المعلومات القيّمة ما يبرر الموارد المستخدمة.

معايير الملاءمة القياسية

ضمن هذه المعايير أن يكون التقييم أخلاقياً وأن يلتزم تنفيذه حقوق ومصالح المعنيين به. وتتمثّل المعايير الثمانية هنا في:

وجهة الخدمات: ينبغي أن تُعمم التقييمات بحيث تساعد المنظمات مساعدةً فعالة في خدمة حاجات المشاركين المستهدَفين.
الاتفاقات الرسمية: يجب الاتفاق خطياً على المسؤوليات في التقييم (أي ما يجب فعله، وكيف، ومَن ومتى) بحيث يتوجب على جميع المعنيين الالتزام بشروط الاتفاق أو أن يعيدوا مناقشته بشكل رسمي.
حقوق الإنسان: على التقييم أن يُصمّم ويُنفّذ بطرق تحترم وتحمي حقوق وخير الأشخاص، أي جميع المشاركين في الدراسة.
التفاعل الإنساني: عند العمل على التقييم مع الآخرين على المقيّمين احترام الكرامة والقيمة الإنسانية الأساسية حتى لا يشعر المشاركون بأي تهديد أو أذى.
قياس كامل ومنصف: على التقييم أن يكون كاملاً ومنصفاً في طريقة فحص وتسجيل نقاط القوة والضعف في البرنامج الذي يجري تقييمه. هذا يسمح بالبناء على نقاط القوة وعلى مخاطبة مجالات المشكلات.
كشف النتائج: على العاملين على التقييم ضمان أن تكون جميع نتائج التقييم، وكذلك قصورات التقييم، في متناول كل فرد يتأثر بالتقييم وكذلك في متناول كل من يتمتع بحق قانوني معلن في الحصول على النتائج.
تضارب المصالح: يجب التعامل مع تضارب المصالح بصراحة وأمانة حتى لا يؤثر سلباً على عمليات التقييم ونتائجه.
المسؤولية المالية: يجب أن يعكس استخدام الموارد إجراءات سليمة في مساءلة المقيّم عنها وأن يكون المقيّم حكيماً ومسؤولاً من الناحية الأخلاقية بحيث تستقيم المساءلة عن النفقات وتكون مناسبة.

معايير الدقة القياسية

تضمن هذه المعايير أن يُنظر إلى نتائج التقييم على أنها صحيحة. وهناك 12 معياراً:

توثيق البرنامج: يجب وصف البرنامج وتوثيقه بوضوح ودقة بحيث يجري تحديد ما يجري تقييمه بوضوح.
تحليل السياق: يجب فحص السياق الذي يقوم فيه البرنامج فحصاً ثاقباً حتى يجري تحديد المؤثرات على البرنامج.
الأغراض والإجراءات الموصوفة: يجب رصد أغراض وإجراءات التقييم ووصفها بما يكفي من التفاصيل ما يسمح بتحديدها وقياسها.
مصادر ومعلومات يمكن الدفاع عنها: ينبغي وصف مصادر المعلومات المستخدمة في برنامج التقييم بتفصيل يكفي لقياس كفاية المعلومات للغرض.
معلومات صالحة: يجب اختيار إجراءات جمع المعلومات، وتطويرها ثم تطبيقها، بطرق تضمن أن يكون التفسير الناتج صالحاً.
معلومات موثوقة: يجب اختيار إجراءات جمع المعلومات، وتطويرها ثم تطبيقها، بطرق تضمن أن تكون المعلومات موثوقة بما يكفي.
معلومات منتظمة: يجب مراجعة المعلومات من التقييم بشكل منتظم وتصحيح أي أخطاء قد تظهر.
تحليل المعلومات الكمية: ينبغي تحليل المعلومات الكمية (البيانات الناجمة عن المشاهدات وأعمال المسح) في التقييم تحليلاً ملائماً ومنتظماً بحيث يجري الرد على أسئلة التقييم رداً فعالاً.
تحليل المعلومات النوعية: ينبغي تحليل المعلومات النوعية (المعلومات الوصفية الناجمة عن المقابلات ومصادر أخرى) في التقييم تحليلاً ملائماً بحيث يجري الرد على أسئلة التقييم رداً فعالاً.
استنتاجات مبرَّرة: يجب أن تكون استنتاجات التقييم مبرّرة تبريراً واضحاً حتى يفهم أصحاب المصلحة قيمتها.
تبليغ متجرد: إجراءات التبليغ عن نتائج التقييم، أو الإعلان عنها، يجب أن تحرص على منع تشويه تسببه مشاعر أو انحيازات الأشخاص المعنيين بالتقييم بحيث تعكس تقارير التقييم نتائج التقييم بإنصاف.
تقييم التقييم: يجب تقييم التقييم في حد ذاته باستخدام المعايير أعلاه وغيرها من المعايير القياسية المعنية، وذلك لضمان سلامة توجيهه وكذلك من أجل أن يتمكن أصحاب المصلحة – بعد اكتماله – من تفحص نقاط قوته وضعف من قرب.

الأداة رقم 3 (أنظر الأدوات) ترسم الخطوات الأبكر في ممارسة التقييم (مثلا، إشراك أصحاب المصلحة) والمعايير القياسية ذات الصلة (مثلاً، المنفعة).

تطبيق إطار العمل: إجراء التقييمات الأمثل

يزداد تباعاً الاتفاق على قيمة التقييم. في الواقع، كثيراً ما يطلبه المموّلون وغيرهم. لذا لم يعد في يد المهنيين الصحيين والتنمويين أن يتساءلوا عن تقييم برنامجهم من عدم تقييمه. بل أصبحت الأسئلة المناسبة هي التالية:

ما أفضل طريقة للتقييم؟
ما الذي سنتعلمه من التقييم؟
كيف سنستخدم ما نتعلمه من أجل أن نصبح أكثر فعالية؟

إن إطار العمل على تقييم البرنامج يساعد على الرد على هذه الأسئلة من خلال إرشاد المستخدمين إلى استراتيجيات التقييم النافعة والمجدية والملائمة والدقيقة.

بتطلب استخدام إطار العمل هذا قدراً لا يُستهان به من المهارة في تقييم البرنامج. في معظم الحالات علينا مراعاة أصحاب مصلحة متعددين، ويكون السياق السياسي حاسماً. ولا تتبع الخطوات دائماً نظاماً منطقياً، كما إن قلّة الموارد قد تجعل من الصعب إتباع مسار التحرك المفضل. ويواجه المقيّم التحدي المتمثّل في بناء الإستراتيجية الأمثل في ظلّ الظروف التي يعمل فيها. والإستراتيجية الأمثل هي تلك التي تنجز كل خطوة من خطوات إطار العمل بطريقة تأخذ في حسبانها سياق البرنامج والتي تكون قادرة على تلبية المعايير القياسية المعنية أو حتى تخطيها.

إطار العمل هذا يجعل من الممكن الاستجابة لمصادر القلق العامة الخاصة بتقييم البرنامج. على سبيل المثال، لا يجري تنفيذ الكثير من التقييمات لمجرد أنها باهظة الكلفة. إلا أن كلفة التقييم تبقى نسبية، وهي تتوقف على السؤال المطروح وعلى مستوى اليقين المطلوب في الجواب. ويمكن لتقييم قليل الكلفة أن يوفر معلومات ثمينة بالنسبة للفهم والتحسين.

بدلاً من أن نصرف النظر عن التقييم بوصفه عملاً جانبياً يستهلك الوقت، فإن إطار العمل يشجع التقييمات الموقّّّتة توقيتاً استراتيجياً يزودنا بالمردود المعلوماتي الضروري، وهذا يمكننا من أن نربط التقييم ربطاً وثيقاً بالممارسات اليومية.

ويتمحور اهتمام آخر حول المتطلبات الفنية الملحوظة الخاصة بتصميم وتنفيذ التقييم. إلا أن المقاربة العملية التي يؤيدها إطار العمل هذا تركز على الأسئلة التي يمكن أن تحسّن البرنامج. إلى ذلك، فإن الروابط الرقمية (لينْكْسْْ) إلى النصوص الأخرى في "عدة العمل المجتمعي" الخاصة بالمعلومات عن "كيف نعمل" تساند استخدام إطار العمل هذا (انظر الأداة رقم 1).

أخيراً، فإن فكرة إجراء تقييم تقلق كثيراً من العاملين لأنهم يرون في طرق التقييم عقاباً ("لا يهمهم سوى إظهار أخطائنا")، أو إقصاءً ("لماذا لا تشركوننا؟ نحن نعرف كيف تسير الأمور"). أما إطار العمل فإنه يشجع على استخدام مقاربةً إلى التشجيع مصمّمةً لمساعدة أصحاب المصلحة المهتمين وإشراكهم في عملية ترحب بمشاركتهم.

الأداة رقم 4 تقدم قائمة مراجعة– أو تَفقّّد – لتقرير ما إذا كان التقييم يلبي المعايير الموصى بها.

باختصار

التقييم استراتيجية قوية للتمييز بين البرامج والتدخلات التي تصنع فرقا،ً من جهة، وبين تلك التي لا تفعل، من جهة أخرى. إنه قوة دافعة تعمل على تطوير وتكييف الاستراتيجيات، وتحسين البرامج القائمة، وإظهار نتائج الاستثمار في الوقت والموارد الأخرى. ويساعد التقييم أيضاً على تحديد ما إذا كان ما يجري من عمل يستحق كلفته.

إطار العمل الموصى به هذا لتقييم البرنامج هو – في الوقت نفسه – تركيبة تجمع أفضل الممارسات القائمة ومجموعة من المعايير القياسية لتحسينات إضافية. إنه يدعم مقاربة عملية إلى التقييم مبنيّة على خطوات ومعايير قياسية يمكن تطبيقها في أي وضعية كان. وحيث أن الإطار عام بشكل مقصود فإنه يوفر دليلاً مستقراً يستخدم في تصميم وتطبيق نطاق واسع من جهود التقييم في مجالات متنوعة من البرامج المحددة. ويمكن استخدام إطار العمل قالباً لابتكار خطط مفيدة من التقييم يساهم في الفهم والتحسين.

Contributor

Bobby Milstein

Scott Wetterhall

CDC Evaluation Working Group

File Upload

36.1 evaluation framework.jpg