Archive

Archives pour la catégorie ‘Ecosystème BI’

SAP BPC 10 Net Weaver, quand le Business reprend la main !

Il y a tout juste un mois, nous présentions au Restaurant Le Meurice la dernière version de SAP-BPC (Business Planning & Consolidation), sur plateforme NetWeaver, BPC10. Téléchargez la présentation !

Pour X ou Y raisons, vous n’avez pu y participer, et vous le regrettez car :

  • Vous savez qu’en temps de coups durs économiques, la rationalisation de vos processus et de vos coûts passe par une réflexion autour des problématiques d’élaboration budgétaire.
  • Vous êtes équipés BW et/ou êtes sur le point de vous équiper, ou de finaliser votre mise en place de BW.
  • Vous en avez assez de vous « arracher les cheveux » à traiter tous les mois une 100aines de fichiers Excel qui transitent par mail à chaque période de reporting…

Il est temps pour nous de vous faire un bref retour sur cet évènement :

  • Succès,
  • Satisfaction,
  • Positionnement sur le Marché,
  • Crédibilité aussi bien Fonctionnelle que Technique,

=> Nous sommes VOTRE Partenaire, et sommes prêts à vous accompagner !

Et maintenant, vous vous demandez comment engager la discussion ?
Plusieurs options s’offrent à vous :

  • Votre Projet est déjà bien avancé, et vous voulez en savoir plus et avez besoin d’une démo « Live » avec Questions/Réponses ? Contactez-nous !
  • Votre Projet est encore à un stade embryonnaire et avez besoin de plus de réflexion avant d’envisager les « Next Step » plus concrets : nous vous proposons plusieurs rendez-vous en vidéo, à suivre prochainement sur notre Blog Homsys!

Innovation, performance, réactivité, simplicité : n’attendez plus pour choisir et migrer vers SAP BO 4 !

Déjà plébiscitée par des millions d’utilisateurs, la dernière génération SAP BusinessObjects 4 permet de couvrir tous les besoins d’accès aux informations de l’ensemble de vos collaborateurs, et ce, quel que soit le progiciel utilisé ou les données sources !

  • Vous vous interrogez encore sur l’intérêt et le retour sur investissement de la nouvelle version de SAP BusinessObjects ?
  • Vous doutez encore de la stabilité de la version cible ?
  • Vous craignez une perte de données et une perte de service pendant la migration ?
  • Vous pensez que passer à la version B0 4 entrainera un surcoût de licences ?

=> Venez participer au séminaire organisé par Homsys et SAP le 14 mars à Bordeaux ! Il répondra à toutes vos questions !

Informations et inscription gratuite en ligne sur www.homsys.com

Le Gartner Magic Quadrant 2013 pour la BI

Gartner a publié ce mois-ci la dernière version de son « Magic Quadrant » pour les outils de Business Intelligence et plate-formes d’analyse. En représentant toutes les solutions du marché sur 2 axes: la faculté d’exécution et la complétude de la vision, cette étude propose de classer chaque outils en quatre catégories : les marchés de niche, les visionnaires, les challengers et les leaders.

La comparaison de cette dernière mouture avec les cartographies établies les années précédentes par Gartner (voir ci-dessous) permet de dégager les tendances du moment. Pour cette année on peut remarquer:

  • Microsoft: La société de Redmond progresse encore sur l’habilité d’exécution, ce qui lui permet de rester leader dans ce domaine. On remarquera tout de même qu’il n’est dorénavant plus « seul au monde » dans ce secteur comme c’était le cas en 2011, maintenant qu’il est sérieusement talonné par Tableau et Qliktech qui progressent aussi dans cette catégorie
  • SAS: il avance sur les deux axes (faculté d’exécution et complétude de la vision) dans son élan des années précédentes
  • Micro Strategy: il maintient sa position de leader en se stabilisant sur les deux axes depuis plusieurs années maintenant
  • Tableau: On a commencé à l’évoquer plus haut, mais Tableau est incontestablement la valeur montante. Avec une forte progression à la fois sur l’habilité d’exécution et la complétude de vision depuis 2 ans. De challenger, tendance « joueur de niche » en 2011, Tableau Software a réussi à faire de son outil un des leaders de 2013.
  • SAP, IBM, Orable …: Les « poids lourds » comme conservent leur position de leader avec une excellente vision d’ensemble probablement en qualité d’ »historiques » du secteur
  • Niche players: Il est difficile pour tous les « niche players » d’élever leur catégorie de marché. Ainsi on retrouve depuis 3 ans les mêmes acteurs qui alternent dans les positions d’honneur de la catégorie

Le Magic Quadrant 2013:

Gartner Magic Quadrant 2013 - Business Intelligence

Le Magic Quadrant 2012:

Gartner Magic Quadrant 2012 - Business Intelligence

Le Magic Quadrant 2011:

Gartner Magic Quadrant 2011 - Business Intelligence

SAP BPC NetWeaver 10 : quand le Business reprend la main !

L’élaboration budgétaire est un processus essentiel dans la planification, la mesure et l’atteinte de vos objectifs ! D’autant plus important aujourd’hui dans un contexte économique de plus en plus soumis à la pression des marchés et de la concurrence. Aussi, vos prévisions doivent à tout moment être au plus juste.

Réactivité, Souplesse, Performance, tels seront les principaux enjeux de l’outil qui vous guidera vers cette excellence budgétaire.

SAP BusinessObjects Planning & Consolidation (BPC) vous permet de conduire un processus d’élaboration budgétaire structuré et collaboratif ! Intégré à SAP BW et SAP BO4, la dernière version de SAP BPC innove : nouvelle interface client web, publications et reportings simplifiés, intégration complète à SAP BW, optimisation avec SAP Hana…

C’est sur ce thème qu’Homsys (groupe Viseo) et SAP ont le plaisir d’inviter leurs clients et prospects à déjeuner le 21 mars dans le cadre prestigieux du restaurant Le Meurice. Plus d’informations : www.homsys.com

Homsys et Informatica, leader mondial des plateformes d’intégration de données

Interviewé à l’occasion de l’Informatica Day le 4 octobre 2012, Yves Cointrelle présente le partenariat avec Informatica et sa représentation en France sur l’ensemble de l’offre Informatica (y compris des offres méconnues telles que Data Replication). Voir la vidéo : http://www.youtube.com/watch?v=rJJqC3w5K1s

Homsys est partenaire d’Informatica depuis plus de 10 ans. La relation est née au sein du département décisionnel d’Air France peu de temps après l’implantation de l’éditeur sur le marché français.

« Notre devoir de conseil est d’orienter nos clients vers les technologies les plus fiables et les plus robustes. Au-delà de l’alimentation de systèmes décisionnels, la valeur ajoutée de PowerCenter est aussi mesurable dans les projets de migration et de consolidation de systèmes, ou encore d’urbanisation de systèmes d’information. » Yves Cointrelle, Directeur général d’Homsys.

Data & Innovation : L’EIM au cœur de la stratégie des entreprises !

A l’occasion de la matinée consacrée par SAP à l’EIM, qui s’est déroulée le 27 novembre à Paris, Yves Cointrelle, Directeur général d’Homsys, est revenu pour nous sur les enjeux entourant la qualité de la donnée. L’occasion également de faire le point sur la maturité des offres dans un contexte Big Data et sur le rôle critique de la méthodologie dans un projet décisionnel.

Retrouvez l’article dans son intégralité : Yves Cointrelle , Directeur général d’Homsys : « en matière d’EIM l’enjeu clé repose sur la confiance que l’on peut avoir dans le système »

Categories: Ecosystème BI Tags: , , ,

Informatica ILM Test Data Management

09/11/2012 un commentaire

Dans cet article, nous étudierons la solution ILM d’ Informatica – Informatica Test Data Management.

Nous décrirons un process d’utilisation sur un exemple concret.

Nous donnerons à notre sens les points forts et les points faibles du produit.

ILM est un acronyme anglais faisant référence à la gestion du cycle de vie de l’information.

L’ILM se définit comme une réflexion globale sur la gestion rationnelle du patrimoine d’information de l’entreprise en fonction de la valeur de l’information et du coût de son stockage.

Une démarche d’ILM permet d’appliquer des règles de stockage différentes selon la valeur de la donnée à sauvegarder, afin d’adapter au mieux les critères suivants :

  • utilité de la donnée
  • exigences de sécurité : intégrité, confidentialité et disponibilité des données
  • exigences réglementaires sur les données
  • temps d’accès aux données
  • coût de stockage

Dans les années 2004-2005, le marché de l’ILM semble porteur…

L’ILM concerne surtout les grandes entreprises. Toute société engagée dans des processus de certification se voit contrainte de faire appel à l’ILM pour répondre aux obligations de traçabilité et d’archivage légal.

Les fonctionnalités des produits spécialisées ILM sont exclusivement orientées vers des solutions de stockage. Une poignée d’acteurs significatifs se partage le marché avec des solutions complètes de bout en bout (EMC, HP, IBM, Sun, Network Appliance).

Mais, il reste que le marché de l’ILM ne peut se suffire aux seuls projets d’archivage en raison peut être du coût de moins en moins onéreux des périphériques de stockage.

Février 2009 : un nouvel arrivant sur le marché de l’ILM pour une nouvelle vision ?

En Février 2009, Informatica acquiert l’éditeur Applimation (Informia) pour 40 millions de dollars.

La suite ILM d’ Informatica s’affirme en s’étoffant d’une palette d’outils hétéroclites et de nouvelles fonctionnalités.

Aux modules d’archivage Data Archive et Data Validation Option déjà présents dans sa suite ILM viennent s’ajouter une suite de logiciels hétéroclites, qui regroupés ensemble, offre une plate-forme complète d’outils dédiés à la Gestion du cycle de vie de la donnée.

architecture tdm

               source : ILM TDM Student Guide

Avant le rachat d’Applimation (Informia), Data Masking Option (DMO) et Data Validation Option pouvaient être vendus séparément et intégrés dans l’ETL PowerCenter par l’acquisition d’une licence supplémentaire.

Aujourd’hui, leurs acquisitions individuelles ne sont plus permises. Le client doit acheter le pack Informatica ILM Test Data Management (TDM).

Les produits de la suite Applimation (Informia) ont été intégrés dans la suite ILM d’Informatica dans Informatica ILM Test Data Management (voir tableau ci-dessus).

Aujourd’hui Informatica ILM TDM fait partie intégrante de la solution complète d’ILM d’ Informatica.

 

Les composants logiciels d’Informatica ILM Test Data Management (TDM)

Informatica ILM – Test Data Management  est un sous – ensemble de la suite d’Informatica ILM.

Informatica ILM Test Data Management (TDM) est composé de 3 briques logicielles :

  1. Data Subset pour extraire et fournir des échantillons de données à partir d’un modèle relationnel en respectant l’intégrité référentielle
  2. Data Masking : pour masquer des données sensibles  et confidentielles d’un échantillon de données pour les fournir à un tiers
  3. Data Discovery pour explorer et découvrir les champs de tables éligibles au statut de clé primaire, ou de clé étrangère d’un modèle relationnel qui en est dépourvu.

 

Comment cela marche ?

Les services d’ILM Test Data Management sont pilotés par ILM server : c’est le service applicatif qui gère les interactions entre le client ILM TDM (ILM Workbench)  et les services applicatifs de PowerCenter et de Data Explorer

  • Les services Data Explorer vont gérer les opérations de découverte et de profilage des données (Data Discovery)
  • Les services de PowerCenter vont gérer les opérations d’extraction des échantillons de données (Data Subset) et leur masquage (Data Masking)

architecture_tdm_2

Source : User Guide ILM TDM 9.3

 

Comment utiliser Informatica ILM Test Data Management ?

Prenons comme exemple fictif, le cas de l’entreprise WEAVETECO.

Cette société veut mettre en application une politique de sécurité très performante pour masquer les données sensibles lorsqu’elle diffuse des données pour ses environnements de développement et de qualification.

Elle va utiliser les services de la plate – forme d’ILM Test Data Management.

Le projet de la société WEAVETECO (distributeur de contenus vidéo payants) va s’effectuer en 4 étapes distinctes :

  • Data Import Process
  • Data Discovery Process
  • Data Subset Process
  • Data Masking Process

 

Le Data Import Process

La première étape consiste à identifier les données que l’on veut importer.

La société WEAVETECO souhaite extraire de son Datawarehouse l’ensemble des informations concernant les clients et les factures clients.

Un nouveau projet CRM est en cours et elle doit fournir aux équipes de développement et de test, un échantillon de données cohérent et fiable.

Les données nécessaires pour construire cette base CRM s’appuie sur deux Datawarehouse. Ces deux modèles de données sont alimentés par des traitements Informatica PowerCenter. Leurs métadonnées sont donc disponibles à partir du Repository PowerCenter.

Le rapatriement des métadonnées dans Informatica ILM Test Data Management va pouvoir être opéré avec le client ILM Workbench.

  • A partir du client ILM TDM – (ILM Workbench), les métadonnées du Repository PowerCenter relatives aux modèles de données du DataWarehouse Client et du Datawarehouse Factures clients sont importées dans le Repository ILM
  • Le service ILM Server transfert les métadonnées du Repository de PowerCenter dans le Repository ILM.

 Le Data Discovery Process

La seconde étape consiste à identifier les clés primaires ou étrangères potentiels des deux Datawarehouse.

Problème : les deux équipes de développement travaillent sur deux modèles de données différents mais complémentaires. Chaque SSII maitrise parfaitement son modèle de données mais il ne connait pas très bien le modèle de données de l’autre SSII.

  • la SSII A travaille sur le Datawarehouse Clients
  • la SSII B travaille sur le Datawarehouse Comptabilité

Le chef de projet CRM souhaite :

  • identifier les interactions entre les deux Datawarehouse
  • identifier les données confidentielles dites sensibles

La découverte des clés primaires et des clés étrangères va pouvoir être opéré avec l’outil Data Discovery.

  • A partir du client ILM TDM – (ILM Workbench), il est nécessaire de se connecter aux deux Datawarehouse pour récupérer les métadonnées.
  • L’outil détectera les clés primaires ou les clés étrangères potentielles entre les différentes tables.
  • Par exemple : identifier que la clé primaire de la table client du Datawarehouse Client est identique à la clé primaire de la table factures clients du Datawarehouse Comptabilité.
  • Il appartient ensuite au chef de projet CRM de suivre ou non les recommandations de l’outil Data Discoverypour appliquer ou non les clés primaires ou étrangères sur  les tables des deux Datawarehouse.
  • Le service ILM Server a envoyé une requête au Data Integration Service pour extraire le profil des données de chaque table. Le Data Integration Service a ensuite chargé le profilage de chaque table dans le Repository du Profiling Warehouse.

Le Data Subset Process

La troisième étape consiste à créer un échantillon de données regroupant les données des deux Datawarehouse Clients et Comptabilité. Cette dernière étape s’effectue en trois phases.

i.        Le chef de projet CRM doit  identifier les tables des deux Datawarehouse qu’il va devoir sélectionner pour son propre modèle de données CRM.

Exemple : sur la centaine de tables de fait et de dimensions qu’il a pu identifier sur les deux modèles de données avec Data Discovery. Seuls 15 tables de dimensions et trois tables de fait sont nécessaires pour créer son modèle de données CRM.

ii.        Le chef de projet CRM doit appliquer des contraintes d’intégrité sur les colonnes des tables qu’il a pu détecter dans le Data Discovery Process. Il doit ensuite sélectionner un échantillon de données en créant un subset basé sur un critère de sélection.

Exemple : sélectionner les tables des deux modèles  qui constitueront son modèle relationnel CRM final et appliquer un critère de sélection sur la région des clients

iii.        Le chef de projet CRM doit générer un traitement PowerCenter qui va alimenter son modèle relationnel CRM.

La génération des échantillons de données va pouvoir être opéré avec l’outil Data Subset.

     i.        A partir du client ILM TDM – (ILM Workbench), il faut créer une application Test Data Management et y incorporer le modèle de données relationnel CRM dans des entities et des groups.

  • Une entities définit un ensemble de tables reliées entre elles par des liens physiques ou des contraintes logiques (clés primaires et étrangères)
  • Un group est un ensemble de tables n’ayant aucun lien physique entre elles ou pour lequel il n’y aucune règle de Data Masking.

ii.        Data Subset va appliquer un critère de sélection pour extraire un échantillon de données (subset).

iii.        Le chef de projet CRM va implémenter son application Test Data Management en créant un plan à partir duquel il va générer un workflow PowerCenter pour alimenter son modèle cible CRM.

  • L’ILM Server stocke les objets créés avec le Workbench (applications, entities, groups, rules, policies, plans) dans le Repository ILM.
  • Lors de la génération du workflow à partir du plan, le Powercenter  Repository Service se charge de stocker  le workflow et ses composants dans le Repository PowerCenter.
  • Enfin c’est le Powercenter Integration Service qui exécute le workflow pour charger les données dans la base cible.

Le Data Masking Process

La troisième étape consiste à masquer les  informations de l’échantillon de données extrait des deux Datawarehouse.

Certaines informations de l’échantillon de données sont très sensibles. La direction de WEAVETECO souhaite que les données qui seront transmises aux équipes de développement et de qualification soient masquées  afin de conserver une totale confidentialité.

Dans la partie Discovery Process, le chef de projet CRM a appliqué les clés primaires et les clés étrangères sur son modèle de données CRM.

Une autre tâche lui incombe. Il doit anonymiser les données confidentielles. Il note que certaines données sont très sensibles (Ex : n° de client, nom, prénom, n° de carte bleu, n° de téléphone, email de contact, date de naissance, montant des factures, genre du film).

Les difficultés auxquelles il doit faire face sont les suivantes :

  • conserver une intégrité entre les données : son modèle CRM doit respecter une intégrité référentielle et les données doivent garder une homogénéité globale entre elles.
  • propager la clé primaire dans le modèle : la clé primaire de certaines tables se base sur le N° de client et cette donnée est présente dans plusieurs tables du modèle CRM final sous forme de clé étrangère
  • gérer le masquage des champs composés : certains champs dont le N° de client résulte d’une concaténation de plusieurs champs qui sont eux-mêmes anonymisés en amont.

Exemple : le N° de client est la concaténation de la première lettre du prénom, du nom patronymique, des 5 derniers chiffres du téléphone et de la typologie du sexe

Ci-joint un exemple final de masquage de données.

COLONNES Données réelles Données masquées
N° DE CLIENT NTARKOPY524691 CDOVIETRI513892
PRENOM NORBERT CARMEN
NOM TARKOPY DOVIETRI
SEXE1 pour Homme2 pour Femme 1 2
TELEPHONE 01 43 25 24 69 07 34 45 13 89
VILLE PARIS (75) HAUTS DE SEINE (92)
DATE DE NAISSANCE 28 – 01 – 1955 12 – 03 – 1982
N° de C.B. 0123 4567 8901 8765 0145 4578 3201 4545
EMAIL NORBERT.TARKOPY@MAFRANCE.COM CARMEN.DOVIETRI@MAGUITARE.FR
FACTURE 234 EUROS 6 EUROS
NOM DU FILM LES PLAISIRS D’EMMANUELLE LA CONQUETE
GENRE DU FILM EROTIQUE DRAMATIQUE

Le masquage des données va pouvoir être opéré avec l’outil Data Masking.

  • Le client ILM TDM – (ILM Workbench) permet de sélectionner les champs candidats au masquage et de les déclarer comme sensibles (sensitive).
  • Après avoir sélectionné les données dites sensibles, il faut leur appliquer des règles de masquage de données (rules, policies)
  • L’ILM Server stocke les objets créés avec le Workbench (rules, policies) dans le Repository ILM. Lors de la génération du workflow à partir du plan, le Powercenter  Repository Service se charge de stocker  les règles de masquage dans le Repository PowerCenter.

 

Quels sont les points forts et les points faibles d’Informatica ILM Test Data Management ?

Points négatifs :

  • IHM du client ILM Workbench difficile à appréhender en raison des menus   contextuels nombreux
  • Mise à jour et suppression de TDM vers PowerCenter : en cas de nouvelle génération de workflow par ILM, il est fortement conseillé de supprimer l’ensemble des métadonnées PowerCenter déjà présente. ILM TDM n’effectue pas de suppression au préalable. Le processus peut s’avérer fastidieux dans un mode développement évolutif.
  • complexité du modèle de métadonnées de l’ILM Repository

Points positifs :

  • intégration des produits ILM dans PowerCenter
  • communication entre les Repository ILM, PowerCenter et Data Explorer
  • recherche et exploration facile dans les métadonnées ILM
  • richesse des algorithmes de masquage
  • réutilisation facile des règles de masquage au sein de l’entreprise
  • masquage des données par pattern
  • génération des rapports sur les données sensibles
  • génération rapide des traitements PowerCenter à partir d’un plan ILM TDM

Conclusion :

Avec l’arrivée d’Informatica, les produits ILM semblent avoir trouvé un nouveau vecteur de croissance. Le marché de l’ILM ne semble plus cantonné au seul problématique d’archivage ou de stockage.

La contribution judicieuse d’Informatica est d’avoir à mon sens intégrer de nouvelles fonctionnalités à l’ILM comme l’anonymisation des données (Data Masking), l’exploration des données (Data Discover)  ou l’échantillonnage des données (Data Subset).

L’association de ces trois produits hétéroclites dans une suite logicielle compacte a redonné un nouveau souffle à l’ILM en trouvant une véritable synergie.

Articles sources de l’article :

Définition ILM :

Applimation Informia – Enterprise Application Data Management :

Fonctionnalités d’ILM TDM :

Prospectives sur le marché de l’ILM :

Tableau de bord : les solutions françaises qui montent

Interviewé par le Journal du Net, Yves Cointrelle (Directeur Général Homsys) nous livre une analyse sur les offres innovantes SaaS ou internalisées de tableau de bord.

« … Au côté des solutions américaines innovantes comme Tableau, QlikView et Spotfire, des offres françaises se distinguent sur le créneau du tableau de bord décisionnel, en particulier Prelytis, BiBoard, DigDash et Bime …»

Retrouvez l’article dans son intégralité : Tableau de bord : les solutions françaises qui montent.

Le programme de Microsoft pour 2012 [2/2]

On en saura sans doute beaucoup plus à l’occasion des Microsoft Techdays 2012 (prévus les 7,8 et 9 Février prochain), mais voici déjà une brève présentation des différents produits et évolutions qui vont désormais constituer l’écosystème BI autour de SQL-Server 2012. SQL-Server « Denali » – c’est son nom de code – est prévu en version commerciale pour la fin de l’année. (Pour l’heure il n’est disponible qu’en Release Candidate depuis le site officiel). Petit tour d’horizon en deux parties.

Ce billet est la suite d’une première partie publiée le 27 Janvier qui présentait les nouveautés 2012 du SGBD SQL-Server, de Integration Services et de Analysis Services ainsi que le nouveau BI Semantic Model (BISM).

Aconcagua

Kilimandjaro 5891m, Denali 6194m, est-ce que l'Aconcagua, plus haut sommet d'Amérique Latine avec 6962m sera le petit nom de la prochaine version de SQL-Server ?

2.1/ Reporting Services

SSRS ne contient pas d’innovation majeure dans sa mouture 2012. Cela fait déjà plusieurs versions que Microsoft n’en fait plus sa priorité et cette outil à l’interface « old school » sera vraisemblablement remplacé prochainement. On attend par exemple toujours de savoir comment il pourra se connecter aux BISM, Microsoft n’étant pas très bavard sur le sujet.

Pour l’heure deux améliorations sont à noter:

  • Une meilleure intégration dans Sharepoint: celle-ci est grandement simplifiée
  • Un système d’alerte utilisateur:  SSRS possède maintenant un système d’abonnement plus efficace et mieux adapté aux besoins des consommateurs de rapports. Il est dorénavant possible de créer des règles qui alerteront vos usagers en fonction du mouvement de vos données dans vos rapports.

2.2/ Power View / Crescent

Power View (nom de code Crescent) est un outil permettant de visualiser les données, de partager rapidement les analyses et de créer des animations de rapports en quelques clics, facilitées par l’utilisation d’un ruban proche d’Office 2010.

Techniquement, Power View permet de manipuler des données dans une interface Silverlight intégrée à SharePoint. Power View s’appuie sur la nouvelle couche sémantique BI (BISM) et utilise un nouveau modèle de données de type tabulaire, utilisé par Power Pivot, et désormais greffé à Analysis Services.

Les analyses Power View se conçoivent comme des animations et peuvent être « publiées » au format Web ou Powerpoint.

Une démo Power View en vidéo:

2.3/ Powerpivot V2

Avec SQL-Server 2012, Powerpivot change de dimension. Avec la version 2008-R2 Powerpivot V1 était surtout un gros plug-in Excel. Aujourd’hui, ce n’est plus seulement un outil autonome, c’est aussi un client et un outil de conception de modèle d’analyse BISM en mode tabulaire. La nouvelle version de l’addin s’aligne avec les projet SSAS Tabular de Visual Studio. Enfin, Powerpivot utilise aussi le langage DAX (qui ressemble à du code de macro Excel) pour accéder aux données.

Principales nouveautés:

  • Création de KPI : permet de définir des objectifs aux mesures et une iconographie pour représenter l’atteinte ou non de ces objectifs
  • Tri des membres en fonction d’une autre colonne
  • Vue en mode Diagramme (comme dans Visual Studio)
  • Table de temps : permet de définir une dimension comme “temporelle”
  • Perspectives : permet de définir des “vues” différentes sur le modèle (ex : mesures et dimensions pour les commerciaux et pour le marketing) ; équivalent aux perspectives d’Analysis Services
  • Etc…

Voir aussi cette vidéo en ligne sur Powerpivot.

2.4/ Dependency Services / Projet Barcelona

SQL-Server 2012 propose aussi un outil additionnel qui vaut le détour. Issus du projet « Barcelona » Dependency Services comment ce composant additionnel permet d’aider à la traçabilité des données ou encore de maintenir une documentation à jour sur un processus d’intégration de données. L’idée est de tracer toutes les dépendances des données entre les composants d’une solution BI (sources, SQL, packages SSIS, rapports, modèles PowerPivot, etc.).

L’objectif est de pouvoir répondre à des questions comme : que ce passe t-il si je supprime cette colonne ?

Cet outil permet de générer des métadonnées, sous forme de tableaux ou de schéma qui peuvent ensuite être publié sous forma de pages web.

Voir aussi cette vidéo de présentation de Dependency Services.

2.5/ Parallel Datawarehouse / Projet Madison

Comme pour la version 2008-R2 SQL-Server inclue une offre Parallel Datawarehouse  (ex-projet Madison) qui lui permet de muscler son offre sur le segment du datawarehouse en dopant les performances et la capacité de données traitées.

Il s’agit d’une appliance couplant SQL Server à la technologie de Datallegro – une société rachetée en 2008 par Microsoft – qui vise les méga entrepôts de données. Datallegro fournit une version massivement parallèle (MPP pour Massive Parallel Processing) de SQL Server à même d’être déployée sur un grand nombre de nœuds serveurs afin d’accélérer le traitement des requêtes. Plusieurs partenaires matériels de Microsoft, dont Bull, Dell, HP, EMC et IBM, devrait dans un futur proche proposer des configurations prêtes à l’emploi autour de cette version de SQL Server.

Ces appliances permettent respectivement d’accélérer la mise en place d’un projet de datawarehouse (en fournissant hardware et SQL server pré-installé et optimisé pour un usage décisionnel) et d’assurer des performances optimisées sur des très gros volumes.

2.6/ Windows Azure

Windows Azure est la solution « cloud » de Microsoft. Elle permet d’héberger, exécuter et gérer des applications et données dans le ou les centre de données Microsoft de son choix (dont 2 en Europe).

Windows Azure

Schéma de fonctionnement de Windows Azure, à quand une solution BI complète dans le "cloud" ?

Concernant la business intelligence, Windows Azure n’offre pas encore de solution complète. Si une base relationnelle est disponible dans le nuage (SQL-Azure) avec des fonctionnalités de serveur de rapport qui seront accessible via BIDS 2012 (Business Intelligence Development studio), il faudra attendre encore un peu pour voir une suite BI complète déployée sur Azure. Pour l’heure la seule solution consiste à héberger les données sur les datacenters Microsoft et d’utiliser le connecteur AppFabric pour connecter son propre système d’information aux ressources hébergées chez Microsoft (comme le propose cette société).

Ainsi donc s’achève ce tour d’horizon des nouveautés SQL-Server 2012. Si certaines paraissent être plus de l’ordre du gadget, il y a néanmoins de nombreuses innovations majeures, que ce soit en terme d’outils ou de fonctionnalités, faisant de 2012 une année charnière dans le développement de la BI version Microsoft. On pourra cependant regretter que la firme de Redmond « tâte le terrain » dans toutes les directions dans le but de tester le marché et le besoin, plutôt que d’indiquer clairement la démarche dans laquelle elle souhaite se positionner à l’avenir.

Liens utiles :

Le programme de Microsoft pour 2012 [1/2]

On en saura sans doute beaucoup plus à l’occasion des Microsoft Techdays 2012 (prévus les 7,8 et 9 Février prochain), mais voici déjà une brève présentation des différents produits et évolutions qui vont désormais constituer l’écosystème BI autour de SQL-Server 2012. SQL-Server « Denali » – c’est son nom de code – est prévu en version commerciale pour la fin de l’année. (Pour l’heure il n’est disponible qu’en Release Candidate depuis le site officiel). Petit tour d’horizon en deux parties.

Mont McKinley ou "Denali"

Le mont McKinley, ou "Denali" en langue locale athapascane, plus haut sommet d'Amérique du Nord, culmine à 6194m

1.1/ SQL-Server 2012 aka « Denali »

Pour sa mouture 2012 de SQL-Server, Microsoft met en avant 2 fonctionnalités nouvelles pour son SGBD:

  • Le AlwaysOn qui est une solution de reprise en cas de sinistre (disaster recovery plan) afin de garantir une haute disponibilité de la base de données. Cette fonctionnalité est sensée garantir un « failover » deux fois plus rapide en cas de sinistre. Voir cette vidéo de présentation.
  • Les ColumnStore Index (projet « Apollo ») pour proposer de meilleures performances sur des requêtes de type jointure en étoile. Ces indexes colonnes viennent enrichir la liste des solutions d’optimisation et de tuning existantes sur les précédentes versions (indexes, indexes cluster, statistics…). Plus d’info dans ce livre blanc sur les bénéfices d’Apollo.

On notera aussi d’autres innovations intéressantes sur SQL-Server 2012:

  • Le Change Data Capture (CDC) qui supporte maintenant les bases de données Oracle
  • Le SSMA (SQL Server Migration Assistant), qui permet d’automatiser la migration de base de données non SQL Server vers SQL Server
  • Juneau: une nouvelle interface de développement rassemblant Visual Studio et Management Studio dans la même IDE
  • La fonction FileTable permettant de créer un objet base de données lié à un fichier localisé dans un dossier du système de fichier.
  • Etc…

1.2/ BI Semantic Model (BISM)

La vraie nouveauté conceptuelle de SQL-Server 2012 est l’arrivée du BI Semantic Model (ou BISM). Il s’agit là d’un vrai modèle Business de l’entreprise qui vient rassembler et enrichir les précédentes notions d’UDM (SSAS) et de report model (Report Builder).

Ce modèle est composé de 3 couches:

  • une couche d’accès aux données offrant un accès en ROLAP, MOLAP, Vertipaq (nouveau serveur OLAP en mémoire, faisant partie du projet Apollo), ou direct query
  • une couche Business logique qui offre une structuration des données soit en OLAP via SSAS et MDX ou bien via powerpivot et DAX
  • une couche data model qui supporte les données tabulaires et multi-dimensionnelles

Ces BI semantic models pourront être créés à partir de Visual Studio ou de PowerPivot.

Vous l’aurez compris, Microsoft tente une nouvelle fois de présenter une alternative métier crédible à la  notion d’ »univers » cher à Business Objects. En l’intégrant avec toutes ses technologies existantes (ce qui n’était pas le cas de feu les report models), il semble cette année mettre toutes les chances de son coté. A voir si les BISM tiennent le choc sur le gros volumes.

A noter qu’il n’est pas prévu pour l’instant de possibilité de migrer des UDM en BISM.

BI Semantic Model architecture

Le BISM dans le nouveau écosystème SQL-Server 2012

1.3/ Integration Services

Les nouveautés 2012 concernant l’intégration de données sont articulées autour d’outils complémentaires à SSIS: Data Quality Services et le déjà célèbre Master Data Services.

  • Data Quality Services (DQS): c’est un outil destiné à maintenir et améliorer la qualité des données de l’entreprise en provenance de sources tierces (clients, fournisseurs, …).
    • DQS permet aussi la modélisation métier des données. Par le biais d’une interface client il sera possible de créer des bases de connaissance (type thésaurus).
    • Ces bases contiendront des règles d’épuration, de validation ainsi que les données de référence. DQS est aussi un outil précieux pour le recherche de doublons et dans l’évolution des bases de connaissance.
    • Enfin, les différentes règles de nettoyage pourront être utilisées au niveau les flux de données dans Integration services (SSIS) via un nouveau composant.
  • Master Data Services (MDS) qui existait déjà dans la version précédente de SQL-Server a été grandement amélioré. Il permet de définir les données de références, de gérer les métadonnées. Grâce à son intégration comme plugin d’Excel, il permet de filtrer et modifier les données avant de les visualiser dans Excel. On regrettera qu’il n’existe apparemment toujours pas de système de « lock » pour gérer les accès simultanés…

1.4/ Analysis Services

SSAS est indiscutablement le parent pauvre des nouveautés de cette version Denali. Tellement pauvre que dans la foulée de la présentation l’an dernier son sort a agité la blogosphère spécialisée (voir cet article entre autre). De nombreux experts ont caressée l’hypothèse que Microsoft soit en train de s’employer à mettre son moteur OLAP sur une voie de garage.

Il est vrai que le manque de souplesse des modèles UDM sous-jacents à SSAS a souvent été pointé du doigt tant il représentait une difficulté à résoudre les problématiques métiers les moins standards. Cela a conduit les experts du monde entier à « tordre » l’outil dans tous les sens afin de faire rentrer une logique métier calquée sur du relationnel, dans une modélisation multi-dimensionnelle.

C’est dans cette perspective qu’il faut voir l’arrivée de BISM, Vertipaq et DAX. Ces outils sont destinés à compléter SSAS plus qu’à le remplacer. Car comme cela a été exprimé plus haut, les volumes très importants de données nécessiteront toujours de « dénormaliser » et de passer en dimensionnel. Ces « concurents » au couple SSAS/MDX permettront juste de se simplifier la vie pour modéliser des problématiques métiers relationnelles sur des volumes faibles.

La suite de cet article sur les nouveautés de SQL-Server 2012 sera publiée début Février. Au programme: Reporting Services, Crescent, PowerPivot, Barcelona et Azure !

Liens utiles :