Introdução

Você já se perguntou o que é OLAP? Se sim, esse post irá esclarecer o que é OLAP e suas variações.

Muita confusão existe com alguns termos sobre arquiteturas de OLAP e eles estão proliferando com muita rapidez. ROLAP, HOLAP, MOLAP e DOLAP são exemplos disso e nós tentaremos esclarecer essas siglas, em princípio enigmáticas.

Contexto das nomenclaturas

As grandes quantidades de nomenclaturas que estão aparecendo são algumas variações de estrutura OLAP. A tecnologia em questão surgiu com a evolução dos sistemas de informação.

Esses sistemas no seu começo armazenavam grandes quantidades de dados mas a recuperação dos mesmos tornava-se um tormento para os usuários finais e analistas de sistemas.

Quem não se recorda do quanto era difícil gerar um relatório quando trabalhávamos com Clipper: a dificuldade talvez não fosse em relação à massa de dados, mas sim à grande complexidade de um sistema não-relacional onde tínhamos que sair a procura dos dados em vários arquivos. Assim, para que conseguíssemos construir o relatório dos clientes mais rentáveis no semestre para o gerente de vendas, tínhamos dois grandes trabalhos: Primeiro encontrar os dados, e depois codificar para construir(e depois, quase sempre reconstruir) o relatório no formato desejado. Nem precisamos mencionar o grande porte…

Os SGBD’s (Sistemas Gerenciadores de Banco de Dados) foram evoluindo significativamente junto com as linguagens de programação, o que facilitou um pouco a vida dos analistas de sistemas. As montanhas de dados já poderiam ser acessadas de uma maneira um pouco mais simples, mas ainda longe do ideal, visto que os usuários ainda dependiam de um técnico de informática para ter acesso a qualquer relatório que não havia sido previsto no levantamento do sistema.

Acompanhando a evolução dos sistemas, na década de 90 introduziu-se uma nova classe de ferramentas no mercado, que foi batizada de OLAP (Online Analitical Processing), que permitiam acesso rápido aos dados, conjugado com funcionalidades de análise multidimensional dos mesmos pelos usuários finais. A rapidez exigida tinha de ser satisfatória, algo em torno de 5 segundos para a resposta. A análise deveria ser dinâmica e simples, onde o usuário poderia fazer a consulta que quisesse, sem depender de um técnico, e multidimensional compartilhada. Essa última é a principal característica do OLAP, a qual descreveremos a seguir.

OLAP – Online Analytical Processing

A análise multidimensional é uma das grandes utilidades da tecnologia OLAP, consistindo em ver determinados cubos de informações de diferentes ângulos, e de vários níveis de agregação. Os “cubos” são massas de dados que retornam das consultas feitas ao banco de dados, e podem ser manipulados e visualizados por inúmeros ângulos (usando a tecnologia de slice-and-dice) e diferentes níveis de agregação (usando a tecnologia chamada “drill”).

DOLAP – Desktop Analytical Processing

As ferramentas que disparam uma instrução SQL, de um cliente qualquer, para o servidor e recebem o microcubo de informações de volta para ser analisado na workstation, chamam-se DOLAP (Desktop Online Analytical Processing). O ganho com essa arquitetura é o pouco tráfego que se dá na rede, visto que todo o processamento OLAP acontece na máquina cliente, e a maior agilidade de análise, além do servidor de banco de dados não ficar sobrecarregado, sem incorrer em problemas de escalabilidade. A desvantagem é que o tamanho do micro-cubo não pode ser muito grande, caso contrário a análise passa a ser demorada e/ou a máquina do cliente pode não suportar em função de sua configuração.

ROLAP – Relational Online Analytical Processing

As ferramentas ROLAP (Relational Online Analytical Processing), possuem uma engenharia de acesso aos dados e análise OLAP com uma arquitetura um pouco diferente. Nesse caso a consulta é enviada ao servidor de banco de dados relacional e processada no mesmo, mantendo o cubo no servidor. O que podemos notar nesse caso é que o processamento OLAP se dará somente no servidor. A principal vantagem dessa arquitetura é que ela permite analisar enormes volumes de dados, em contra partida uma grande quantidade de usuários acessando simultaneamente poderá causar sérios problemas de performance no servidor causando, inclusive, o travamento do mesmo.

MOLAP – Multidimensional Online Analytical Processing

A arquitetura MOLAP (Multidimensional Online Analytical Processing) processa-se da seguinte forma:Com um servidor multidimensional o acesso aos dados ocorre diretamente no banco, ou seja, o usuário trabalha, monta e manipula os dados do cubo diretamente no servidor. Isso traz grandes benefícios aos usuários no que diz respeito à performance, mas tem problemas com escalibilidade além de ter um custo alto para aquisição.

HOLAP – Hybrid Online Analytical Processing

Recentemente surgiu outra arquitetura denominada HOLAP (Hybrid On Line Analytical Processing), ou simplesmente processamento híbrido. Essa nova forma de acessar os dados nada mais é do que uma mistura de tecnologias onde há uma combinação entre ROLAP e MOLAP. A vantagem é que com a mistura de tecnologias pode-se extrair o que há de melhor de cada uma, ou seja, a alta performance do MOLAP com a escalibilidade melhor do ROLAP.

Atualmente, todas ferramentas com arquitetura OLAP já estão portadas para web. Nada no que diz respeito a Business Intelligence, distribuição de informação pode ser concebido sem pensar na web. A facilidade em distribuir as informações, a flexibilidade e agilidade são muito grandes.

Abaixo descrevemos mais alguns termos utilizados na arquitetura OLAP.

Consultas ad-hoc

Segundo Inmon “são consultas com acesso casual único e tratamento dos dados segundo parâmetros nunca antes utilizados, geralmente executado de forma iterativa e heurística”.

Isso tudo nada mais é do que o próprio usuário gerar consultas de acordo com suas necessidades de cruzar as informações de uma forma não vista e com métodos que o levem a encontrar aquilo que procura.

Slice-and-Dice/Pivot table

Essa característica das ferramentas OLAP é de extrema importância. Com ela nós podemos analisar nossas informações de diferentes prismas limitados somente pela nossa imaginação. Utilizando esta tecnologia conseguimos ver a informação sobre ângulos que anteriormente inexistiam sem a confecção de um DW e a utilização de uma ferramenta OLAP.

Drill Down/Up

Consiste em fazer uma exploração em diferentes níveis de detalhe das informações. Com o Drill Down você pode “subir ou descer” dentro do detalhamento do dado, como por exemplo analisar uma informação tanto diariamente quanto anualmente, partindo da mesma base de dados.

Geração de Queries

A geração de queryes no OLAP se dá de uma maneira simples, amigável e transparente para o usuário final, o qual precisa ter um conhecimento mínimo de informática para obter as informações que deseja.

Conclusão

Cada uma destas tecnologias e técnicas tem seu lugar no mercado de Business Intelligence (BI) e apoia diferentes tipos de análises. É importante lembrar que as exigências do usuário devem ditar que tipo de arquitetura irá atende-lo melhor. Como sempre, a arquitetura deve estar bem desenhada para que isso aconteça da melhor forma possível e que eles tenham uma experiência de uso ótima.