Le partage des données par différents partenaires et l'agrégation de différentes sources de données sur des plateformes communes nécessitent des investissements importants en termes d'interopérabilité et de format des données. Les données sont interopérables lorsqu'elles suivent des standards/normes techniques communément admises et qu'elles comportent suffisamment de métadonnées pour permettre à un analyste d'identifier la provenance, les concepts, les méthodes et les conseils d'utilisation. 

Les standards et les métadonnées sont toutes deux nécessaires à l'interopérabilité. Sans standards , même les données bien décrites (c'est-à-dire avec des métadonnées) ne sont pas prêtes à être utilisées et, sans métadonnées, il est extrêmement long de comprendre les données ou de les utiliser.

Même au sein d'une même initiative, différents types de données peuvent nécessiter différentes approches en matière de standardisation et d'interopérabilité. Par exemple, la California Data Collaborative reçoit deux types de données : les données de facturation et les données de participation aux programmes. Les premières nécessitent peu de standardisation , car le format de facturation est uniforme dans toutes les agences. En revanche, les formats des données de participation peuvent varier. Le CaDC a donc développé un logiciel que les agences partenaires peuvent utiliser pour standardiser les données de participation avant de les partager.

Si l'accent est souvent mis sur les standards, il est important de reconnaître que les initiatives réussies investissent fortement dans la production de métadonnées de haute qualité. De bonnes métadonnées peuvent faciliter le processus de transfert et d'utilisation des données. Afin de guider les fournisseurs de données, le Humanitarian Data Exchange a élaboré et mis à disposition des instructions claires sur les champs de ressources et de métadonnées requis et fournit un soutien aux nouveaux partenaires pour les appliquer.

Assurer l'interopérabilité entre des ensembles de données disparates

Toute organisation humanitaire peut télécharger ses données sur le Humanitarian Data Exchange. Afin d'assurer que le partage des données sur la plateforme soit transparent, HDX accepte les contributions dans n'importe quel format de données standard. Cependant, dès le début, HDX a reconnu qu'une certaine standardisation était nécessaire pour réduire les difficultés liées au partage des données. 

Son approche originale de la standardisation des données nécessitait du temps et de l'expertise technique de la part des organisations humanitaires contributrices. Mais, en 2014, HDX a relancé cette approche pour développer le langage d'échange humanitaire (HXL). Comme la plupart des données sur HDX étaient stockées dans des feuilles de calcul, la nouvelle approche exigeait simplement que les données incluent un identifiant (un symbole utilisant un hashtag) dans le titre de la colonne, ce qui permet de fusionner les mêmes champs dans plusieurs ensembles de données. Si l'adoption de HXL pose encore des problèmes, les études menées par l'initiative de partage des données montrent qu'elle a considérablement amélioré l'utilisation des données et permis de gagner du temps dans leur traitement.