Skip to content

Hernandesjunio/BulkSort

Repository files navigation

BulkSort Pipeline

Pipeline em .NET para ordenar ficheiros de texto muito grandes armazenados em Azure Blob Storage (external sort em duas fases com merge em camadas) e para calcular o diff entre dois blobs já ordenados (linhas a inserir e a remover).

Requisitos

Executar

Na raiz da solução:

dotnet run --project BulkSortPipeline.Console

Configuração por appsettings.json, variáveis de ambiente ou User Secrets (recomendado para ConnectionString).

Operações

BulkSortHost:Operation Descrição
Sort Lê um blob de origem, ordena com spill local (por omissão) e grava o blob ordenado final.
Diff Descarrega dois blobs ordenados, compara em disco local e envia dois blobs de saída (inserts / deletes).

Chaves obrigatórias por operação estão validadas em PipelineWorker.Validate.

Estrutura do repositório

Caminho Conteúdo
BulkSortPipeline/ Núcleo: serviços, IBlobContainer, opções, algoritmos internos.
BulkSortPipeline.Azure/ Adaptador Azure Blob para IBlobContainer.
BulkSortPipeline.Console/ Host, worker em background, Program.cs e configuração.
BulkSortPipeline.Tests/ Testes.
docs/architecture.md Documentação técnica as-is (fluxos, config, limites).
docs/adr/ Registos de decisões de arquitetura (ADR).

Documentação

Segurança

Não commits connection strings nem account keys em ficheiros versionados. Usa User Secrets ou variáveis de ambiente e mantém appsettings.json apenas com placeholders em repositórios partilhados.

Testes

dotnet test

Alguns testes de integração podem exigir connection string configurada (ver comentários ou traits no projeto de testes).

About

No description, website, or topics provided.

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

 
 
 

Contributors