Statistique Canada
Symbole du gouvernement du Canada

Liens de la barre de menu commune

Avertissement Consulter la version la plus récente.

Contenu archivé

L'information indiquée comme étant archivée est fournie aux fins de référence, de recherche ou de tenue de documents. Elle n'est pas assujettie aux normes Web du gouvernement du Canada et elle n'a pas été modifiée ou mise à jour depuis son archivage. Pour obtenir cette information dans un autre format, veuillez communiquer avec nous.

Traitement du Recensement de 2006

Après les réponses, les chiffres

Durant les deux premières semaines de mai 2006, 70 % des ménages canadiens ont reçu un questionnaire du recensement par la poste, tandis que les 30 % restants en ont reçu un d'un agent recenseur, comme cela se faisait lors des recensements précédents. Les répondants se sont assurés d'« être du nombre » quand ils ont rempli leur questionnaire en ligne ou encore retourné leur questionnaire rempli par la poste.

Le processus de recensement a débuté le 2 mai, car les ménages pouvaient choisir de remplir leur questionnaire en ligne dès la réception de leur questionnaire papier. Cela enclenchait la tâche de convertir en données significatives les réponses d'environ 12,7 millions de ménages. Cette étape du cycle du recensement comporte six activités principales :

  • la réception et l'enregistrement;
  • l'imagerie et la saisie des données des questionnaires papier;
  • le contrôle et le suivi des questionnaire rejetés au contrôle;
  • le codage automatique;
  • le contrôle et l'imputation;
  • la pondération.

Glossaire

Listage/livraison (LL) - Désigne la livraison par des agents recenseurs (plutôt que par la poste) de questionnaires à 30 % des logements au Canada.

Prospection des îlots - Ce travail physique de vérification et de validation sur le terrain vise à mettre à jour les listes d'adresses de la plupart des régions urbaines afin de produire une liste complète et fiable d'adresses (qui sont inscrites dans le Registre de la prospection des îlots), permettant ainsi de poster les questionnaires du recensement dans certaines régions urbaines et urbanisées. La prospection des îlots couvre environ 70 % des logements au Canada.

Recensement - Le recensement consiste à dresser le portrait statistique du Canada lors d'une journée donnée, le 16 mai 2006 en l'occurrence. Il établit un profil démographique, économique et social des personnes, des logements et des exploitations agricoles au Canada ce jour-là.

Registre des visites (RV) - Désigne un document qu'utilisent les agents recenseurs dans les secteurs de LL pour consigner des renseignements sommaires au sujet de chaque logement. Il y a un RV par unité de collecte.

Unité de collecte (UC) - Désigne l'ensemble des logements d'une unité géographique. Il y a 50 000 unités de collecte pour le Recensement de 2006.

Réception et enregistrement - Mai à juillet 2006

Le personnel du Centre de traitement des données de Gatineau, au Québec, a eu la responsabilité d'enregistrer les questionnaires du recensement remplis. Postes Canada en a assuré la réception initiale en lisant les codes à barre par la fenêtre des enveloppes-réponses.

Dans le cadre du Recensement de 2006, Postes Canada a livré les questionnaires papier au Centre de traitement des données, alors que les questionnaires électroniques lui étaient transmis directement. Les questionnaires électroniques étaient enregistrés automatiquement, tandis que les questionnaires papier l'étaient par balayage du code à barres sur la face de l'enveloppe.

Imagerie - Mai à juillet 2006

Le Recensement de 2006 était le premier à saisir automatiquement les données en ayant recours à des technologies de saisie automatisée plutôt qu'à la saisie au clavier.

Étapes de l'imagerie

  • Préparation des documents - Les questionnaires retournés par la poste étaient retirés des enveloppes et préparés pour le balayage en étant débarrassés de tout corps étranger, comme des trombones ou des agrafes. Les questionnaires sous forme de cahier étaient séparés en feuilles isolées.
  • Balayage - Le balayage, réalisé par 18 scanners à grande vitesse, convertissait le papier en images numériques (photos).
  • Assurance de la qualité d'image automatisée - Un système automatisé vérifiait la qualité du balayage. Les images qui étaient rejetées à cette étape étaient signalées afin d'être balayées de nouveau ou d'en saisir les données sur les questionnaires papier.
  • Saisie automatisée des données - La reconnaissance optique de marques et la reconnaissance intelligente de caractères étaient utilisées pour extraire les données des répondants. Lorsque les systèmes étaient incapables de reconnaître l'écriture, la correction des données était faite par un opérateur.
  • Vérification à la sortie - Dès qu'ils avaient franchi toutes les étapes susmentionnées, les questionnaires papier étaient vérifiés. La vérification à la sortie est un processus d'assurance de la qualité qui fait en sorte que les images et les données saisies sont d'une qualité telle que les questionnaires papier ne sont plus nécessaires.

Contrôle automatisé - Mai à juillet 2006

Certains contrôles d'intégralité automatisés simulant ceux qu'aurait faits un agent recenseur étaient effectués à ce point-ci afin de vérifier l'intégralité, la cohérence et la couverture des données. On signalait ici les réponses multiples d'un ménage dans lesquelles on avait décelé une erreur afin de les soumettre à une vérification interactive subséquente.

Suivi des questionnaires rejetés au contrôle - Mai à juillet 2006

Une vérification interactive pouvait se révéler nécessaire pour résoudre les problèmes de réponses manquantes ou invalides; il s'agissait alors d'examiner manuellement les données saisies et les images balayées (s'il y en avait) pour aider à déterminer la bonne réponse. Au besoin, les données des questionnaires des ménages rejetés au contrôle étaient sont transmises à un bureau régional d'Assistance téléphonique du recensement pour y faire l'objet d'un suivi après rejet au contrôle. Un opérateur communiquait alors avec le répondant et obtienait l'information nécessaire en utilisant une application d'interview téléphonique assistée par ordinateur. Les données étaient retransmises au Centre de traitement des données pour être réintégrées dans les systèmes en vue d'un traitement subséquent.

Codage automatisé - Mai à octobre 2006

Le questionnaire complet (2B) renfermait des questions demandant de cocher des réponses dans une liste et des questions demandant au répondant d'écrire la réponse dans les cases prévues à cette fin. Ces réponses écrites devaient être converties en codes numériques avant d'être totalisées pour être diffusées. Au Recensement de 2006, toutes les réponses écrites du questionnaire complet faisaient l'objet d'un codage automatisé et assisté par ordinateur de façon à pouvoir assigner un code numérique à chacune à l'aide des fichiers de référence, des listes de codes et des classifications types de Statistique Canada. Des fichiers de référence étaient construits pour le processus d'appariement automatisé à partir de réponses reçues lors de recensements antérieurs. Des codeurs spécialement formés et des experts se chargeaient de résoudre les cas où il est impossible d'attribuer automatiquement un code numérique.

Le codage s'appliquait aux variables suivantes :

  • Lien avec la Personne 1
  • Lieu de naissance
  • Citoyenneté
  • Langues non officielles
  • Langue parlée à la maison
  • Langue maternelle
  • Origine ethnique
  • Groupe de population
  • Bande indienne/Première nation
  • Lieu de résidence un an auparavant
  • Lieu de résidence cinq ans auparavant
  • Principal domaine d'études
  • Lieu des études
  • Lieu de naissance des parents
  • Langue parlée au travail
  • Industrie
  • Profession
  • Lieu de travail

En 2006, on s'attend à ce que plus de 40 millions de réponses écrites soient codées et à ce qu'environ 75 % d'entre elles le soient automatiquement.

Contrôle et imputation - Septembre 2006 à septembre 2007

Les données recueillies lors d'une enquête ou d'un recensement contiennent des omissions ou des incohérences, que ce soit parce que le répondant a sauté une question ou parce qu'une erreur s'est produite lors du traitement. Un répondant peut, par exemple, refuser de fournir une réponse, ne pas se rappeler la bonne réponse ou mal comprendre une question. Le personnel du recensement peut, quant à lui, mal coder une réponse ou commettre d'autres erreurs pendant le traitement.

Une fois la saisie, le contrôle initial, les corrections et les opérations de codage terminés, les données sont traitées jusqu'à l'étape du contrôle et de l'imputation. On trouve les erreurs à l'étape du contrôle et on les corrige à l'étape de l'imputation. Ces étapes sont importantes parce que :

  • Les utilisateurs ont absolument besoin de données cohérentes, particulièrement pour les données qui servent d'estimations officielles à des fins législatives et administratives;
  • Si les cas de réponses non valables ou manquantes n'étaient pas traités, les utilisateurs devraient totaliser des données incomplètes ou établir leurs propres estimations, qui ne concorderaient pas avec d'autres résultats;
  • De nombreux utilisateurs ne désirent pas rectifier ou totaliser des données incomplètes;
  • Des données valables sont nécessaires pour les besoins de traitement. Ainsi, la composition de la famille est déterminée à partir des renseignements fournis par les répondants sur l'âge, le sexe, l'état matrimonial, le lien avec la Personne 1, etc. Si ces données sont manquantes ou incohérentes, on ne peut pas établir les caractéristiques des familles.

Pondération

Les questions sur l'âge, le sexe, l'état matrimonial, la langue maternelle et le lien avec la Personne 1 sont posées à toute la population. Cependant, la majorité des renseignements du recensement sont recueillis auprès d'un échantillon représentant 20 % de la population à l'aide des questions supplémentaires du questionnaire 2B. La « pondération » sert à reporter les renseignements obtenus auprès de l'échantillon de 20 % de la population sur l'ensemble de celle-ci. La méthode de pondération permet d'obtenir des estimations représentatives à % 100 à partir des données-échantillon de même qu'à maximiser la qualité des estimations échantillonnales.

La méthode de pondération du Recensement de 2006, dite d'estimation par calage, sera la même que pour le Recensement de 2001. Il s'agit d'appliquer des facteurs de pondération initiaux d'environ 5, qu'on ajustera selon le plus petit nombre possible requis pour mieux faire correspondre les estimations échantillonnales (p. ex., le nombre d'hommes, le nombre de personnes âgées de 15 à 19 ans) aux chiffres de population selon l'âge, le sexe, l'état matrimonial, l'union libre et le ménage.

La pondération est la dernière étape de traitement à franchir dans la production de la base de données définitive du Recensement de 2006, qui sera la source de données de l'ensemble des publications, des totalisations et des produits personnalisés.