المبدأ الرابع: تكون البيانات الانتخابية مفتوحةً عندما تكون كاملةً وبدفعة واحدة.

كاملة وبدفعة واحدة

البيانات المفتوحة هي البيانات الكاملة والمتوافرة بشكلٍ كلي. ومن المعلوم أنّ نشر مجموعة كاملة من البيانات دليل على الشفافية. فالبيانات المحذوفة من المجموعة لا يعود بالإمكان الاطلاع عليها ولا يمكن استخدامها. حتى في الحالات التي يكون فيها المستخدم مهتماً بجزءٍ واحدٍ من البيانات، يبقى من المفيد بالنسبة إليه الحصول على المجموعة الكاملة من البيانات ليتمكن من وضع المعلومات المحدّدة التي يريدها في سياقها. على سبيل المثال، قد تفضّل إحدى المنظمات تحليل معدّل تسجيل الناخبين للدوائر الانتخابية في منطقتها. وقد تركز في الجزء الأكبر من تحليلها على البيانات التابعة لتلك المنطقة، ولكن في حال توافرت لديها مجموعة البيانات الكاملة، يكون بوسعها احتساب معدل التسجيل بسرعة للدولة ككل واستخدامه من أجل وضع المعدل الإقليمي في سياقه المناسب. عندما تقوم هيئة إدارة الانتخابات بنشر مجموعة غير كاملة من البيانات، فهي قد تواجه خطر اتهامها بمحاولة إخفاء المعلومات غير المشمولة (عن سابق قصد). ويعتبر الخطر أكبر عندما يكون للفرق بين ما ينشر وما لا ينشر بعداً جغرافياً. في دولٍ عدة، يرتبط الدعم لمرشح أو حزب معين ارتباطاً مباشراً بالجغرافيا (مثلاً، قد تدعم المدن أحد المرشحين في حين يلقى مرشح آخر الدعم الأكبر من المناطق الريفية). وإنّ إدراج البيانات الكاملة مهم أيضاً بشكلٍ خاص عندما يكون للبيانات عنصر جغرافي ذلك أنّ استبعاد منطقة معينة قد يظهر هيئة إدارة البيانات وكأنها منحازة ضدّ مرشح أو حزب معين.

أما نشر البيانات بدفعة واحدة فيعني أنّ البيانات كلّها تكون موجودة في ملف واحد بحيث يمكن تنزيل مجموعة البيانات كاملةً في نقرة واحدة. على سبيل المثال، أتاحت اللجنة الانتخابية لجنوب أفريقيا النتائج الانتخابية على مستوى مكتب الاقتراع (والتي تسمّى بنتائج الدائرة الانتخابية) للانتخابات الوطنية والإقليمية لسنة 2014 دفعةً واحدةً في ملف واحدٍ قابل للتنزيل (بشكل ملف csv. مضغوط). كما أشارت اللجنة الانتخابية إلى نوع الملف وحجمه إلى جانب الرابط الإلكتروني. غالباً ما تشكّل عملية نشر المجموعة الكاملة من البيانات دفعةً واحدة إحدى الخطوات الأولى المباشرة والبسيطة إلى حدّ بعيد التي يمكن أن تتخذها هيئة إدارة الانتخابات من أجل جعل البيانات مفتوحةً على نحوٍ حقيقي. في الحالات التي يبدو فيها الملف أكبر حجماً ويستغرق وقتاً أطول لتنزيله، يجب تقديم البيانات بشكلٍ مجموعة صغيرة من البيانات. في كتابه بعنوان البيانات الحكومية المفتوحة: الكتاب، يعرّف جوشوا تاوبيرير مجموعة البيانات "الأكبر حجماً" على أنها الحالة التي تكون فيها "مجموعة البيانات كبيرةً إلى حدّ يصعب عملياً تنزيلها دفعةً واحدةً. وفقاً للمعايير المطبقة حالياً، يعني ذلك مجموعة البيانات التي يبلغ حجمها 10 جيغابايت، أو تستغرق ست ساعات لتنزيلها على شبكة اتصال عريضة النطاق."

التوثيق الملائم

يمثلّ التوثيق الكافي جانباً إضافياً من كون البيانات كاملةً أو كليةً. إذ يجب أن يرفق الملف بتوثيق خاص به يصف المتغيرات، والميادين، والعلامات المستخدمة في الملف. بالحدّ الأدنى، يجب أن يتضمّن التوثيق ملاحظاتٍ حول بنية البيانات ومسرداً بأي مختصرات للأسماء مستخدمة في البيانات. على نحوٍ مثالي، يشتمل التوثيق على ما ورد أعلاه ويتضمّن وصفاً لطريقة جمع البيانات، والغاية منها، والجمهور المستهدف، والروابط إلى البيانات المساعدة ونقطة الاتصال في حال طرأت أسئلة إضافية. ويفترض بهيئة إدارة الانتخابات، كما هو وارد في ميثاق البيانات المفتوحة والملحق التقني الصادرين عن مجموعة الثمانية، أن تحرص على أن تكون مجموعة البيانات "مرفقةً بوصفٍ شاملٍ، كما هو مناسب، لمساعدة المستخدمين على فهم البيانات فهماً كاملاً". يشكّل مخزن البيانات الانتخابية التابع للمحكمة الانتخابية البرازيلية العليا مثالاً هادفاً عن تقديم هيئة إدارة الانتخابات للبيانات دفعةً واحدةً وإرفاقها بالتوثيق الملائم. يتضمّن المخزن بيانات تسجيل الناخبين، والمعلومات المتعلقة بالمرشحين والأحزاب، وبيانات تمويل الحملات والبيانات المتعلقة بنتائج الانتخابات، بحيث يكون بوسع المستخدم تنزيل نتائج الانتخابات لعامي 2012 و2014 دفعةً واحدةً ويحصل مع البيانات على ملف للقراءة، يفصّل على سبيل المثال كيف تمّ ترميز البيانات، ويقدّم وصفاً لكلّ متغيّرة ويشير إلى آخر موعد تمّ فيه تحديث للبيانات، كما يتضمّن معلومات اتصال للاستفسار أو لطرح أي أسئلة.