After Width: | Height: | Size: 1.6 MiB |
After Width: | Height: | Size: 54 KiB |
After Width: | Height: | Size: 272 KiB |
After Width: | Height: | Size: 8.4 KiB |
After Width: | Height: | Size: 13 KiB |
After Width: | Height: | Size: 497 KiB |
After Width: | Height: | Size: 902 KiB |
After Width: | Height: | Size: 22 KiB |
After Width: | Height: | Size: 1.1 KiB |
After Width: | Height: | Size: 4.5 KiB |
After Width: | Height: | Size: 7.6 KiB |
After Width: | Height: | Size: 4.5 KiB |
After Width: | Height: | Size: 6.1 KiB |
After Width: | Height: | Size: 12 KiB |
After Width: | Height: | Size: 11 KiB |
After Width: | Height: | Size: 12 KiB |
After Width: | Height: | Size: 12 KiB |
After Width: | Height: | Size: 14 KiB |
After Width: | Height: | Size: 11 KiB |
After Width: | Height: | Size: 200 KiB |
After Width: | Height: | Size: 2.0 MiB |
After Width: | Height: | Size: 39 KiB |
@ -0,0 +1,270 @@ |
|||||||
|
digraph UnclePhil { |
||||||
|
kafka [color=gray, label="Kafka"]; |
||||||
|
|
||||||
|
selector1 [label="Selector"]; |
||||||
|
selector2 [label="Selector"]; |
||||||
|
selector3 [label="Selector"]; |
||||||
|
selector4 [label="Selector"]; |
||||||
|
selector5 [label="Selector"]; |
||||||
|
selector6 [label="Selector"]; |
||||||
|
selector7 [label="Selector"]; |
||||||
|
selector8 [label="Selector"]; |
||||||
|
selector9 [label="Selector"]; |
||||||
|
selector10 [label="Selector"]; |
||||||
|
selector11 [label="Selector"]; |
||||||
|
selector12 [label="Selector"]; |
||||||
|
|
||||||
|
process1 [label="ProcessMessages"]; |
||||||
|
process2 [label="ProcessMessages"]; |
||||||
|
process3 [label="ProcessMessages"]; |
||||||
|
process4 [label="ProcessMessages"]; |
||||||
|
process5 [label="ProcessMessages"]; |
||||||
|
process6 [label="ProcessMessages"]; |
||||||
|
process7 [label="ProcessMessages"]; |
||||||
|
process8 [label="ProcessMessages"]; |
||||||
|
process9 [label="ProcessMessages"]; |
||||||
|
process10 [label="ProcessMessages"]; |
||||||
|
process11 [label="ProcessMessages"]; |
||||||
|
process12 [label="ProcessMessages"]; |
||||||
|
|
||||||
|
splitter1 [label="MessageSpliter"]; |
||||||
|
splitter2 [label="MessageSpliter"]; |
||||||
|
splitter3 [label="MessageSpliter"]; |
||||||
|
splitter4 [label="MessageSpliter"]; |
||||||
|
splitter5 [label="MessageSpliter"]; |
||||||
|
splitter6 [label="MessageSpliter"]; |
||||||
|
splitter7 [label="MessageSpliter"]; |
||||||
|
splitter8 [label="MessageSpliter"]; |
||||||
|
splitter9 [label="MessageSpliter"]; |
||||||
|
splitter10 [label="MessageSpliter"]; |
||||||
|
splitter11 [label="MessageSpliter"]; |
||||||
|
splitter12 [label="MessageSpliter"]; |
||||||
|
|
||||||
|
extract1 [label="MetricExtractor"]; |
||||||
|
extract2 [label="MetricExtractor"]; |
||||||
|
extract3 [label="MetricExtractor"]; |
||||||
|
extract4 [label="MetricExtractor"]; |
||||||
|
extract5 [label="MetricExtractor"]; |
||||||
|
extract6 [label="MetricExtractor"]; |
||||||
|
extract7 [label="MetricExtractor"]; |
||||||
|
extract8 [label="MetricExtractor"]; |
||||||
|
extract9 [label="MetricExtractor"]; |
||||||
|
extract10 [label="MetricExtractor"]; |
||||||
|
extract11 [label="MetricExtractor"]; |
||||||
|
extract12 [label="MetricExtractor"]; |
||||||
|
|
||||||
|
keyby [label="keyBy/Hash"]; |
||||||
|
|
||||||
|
window1 [label="Window"]; |
||||||
|
window2 [label="Window"]; |
||||||
|
window3 [label="Window"]; |
||||||
|
window4 [label="Window"]; |
||||||
|
window5 [label="Window"]; |
||||||
|
window6 [label="Window"]; |
||||||
|
window7 [label="Window"]; |
||||||
|
window8 [label="Window"]; |
||||||
|
window9 [label="Window"]; |
||||||
|
window10 [label="Window"]; |
||||||
|
window11 [label="Window"]; |
||||||
|
window12 [label="Window"]; |
||||||
|
|
||||||
|
reduce1 [label="Reduce"]; |
||||||
|
reduce2 [label="Reduce"]; |
||||||
|
reduce3 [label="Reduce"]; |
||||||
|
reduce4 [label="Reduce"]; |
||||||
|
reduce5 [label="Reduce"]; |
||||||
|
reduce6 [label="Reduce"]; |
||||||
|
reduce7 [label="Reduce"]; |
||||||
|
reduce8 [label="Reduce"]; |
||||||
|
reduce9 [label="Reduce"]; |
||||||
|
reduce10 [label="Reduce"]; |
||||||
|
reduce11 [label="Reduce"]; |
||||||
|
reduce12 [label="Reduce"]; |
||||||
|
|
||||||
|
sink1 [label="Sink"]; |
||||||
|
sink2 [label="Sink"]; |
||||||
|
sink3 [label="Sink"]; |
||||||
|
sink4 [label="Sink"]; |
||||||
|
sink5 [label="Sink"]; |
||||||
|
sink6 [label="Sink"]; |
||||||
|
sink7 [label="Sink"]; |
||||||
|
sink8 [label="Sink"]; |
||||||
|
sink9 [label="Sink"]; |
||||||
|
sink10 [label="Sink"]; |
||||||
|
sink11 [label="Sink"]; |
||||||
|
sink12 [label="Sink"]; |
||||||
|
|
||||||
|
kafka -> selector1; |
||||||
|
kafka -> selector2; |
||||||
|
kafka -> selector3; |
||||||
|
kafka -> selector4; |
||||||
|
kafka -> selector5; |
||||||
|
kafka -> selector6; |
||||||
|
kafka -> selector7; |
||||||
|
kafka -> selector8; |
||||||
|
kafka -> selector9; |
||||||
|
kafka -> selector10; |
||||||
|
kafka -> selector11; |
||||||
|
kafka -> selector12; |
||||||
|
|
||||||
|
selector1 -> process1; |
||||||
|
selector2 -> process2; |
||||||
|
selector3 -> process3; |
||||||
|
selector4 -> process4; |
||||||
|
selector5 -> process5; |
||||||
|
selector6 -> process6; |
||||||
|
selector7 -> process7; |
||||||
|
selector8 -> process8; |
||||||
|
selector9 -> process9; |
||||||
|
selector10 -> process10; |
||||||
|
selector11 -> process11; |
||||||
|
selector12 -> process12; |
||||||
|
|
||||||
|
process1 -> splitter1; |
||||||
|
process2 -> splitter2; |
||||||
|
process3 -> splitter3; |
||||||
|
process4 -> splitter4; |
||||||
|
process5 -> splitter5; |
||||||
|
process6 -> splitter6; |
||||||
|
process7 -> splitter7; |
||||||
|
process8 -> splitter8; |
||||||
|
process9 -> splitter9; |
||||||
|
process10 -> splitter10; |
||||||
|
process11 -> splitter11; |
||||||
|
process12 -> splitter12; |
||||||
|
|
||||||
|
splitter1 -> extract1; |
||||||
|
splitter1 -> extract1; |
||||||
|
splitter1 -> extract1; |
||||||
|
|
||||||
|
splitter2 -> extract2; |
||||||
|
splitter2 -> extract2; |
||||||
|
splitter2 -> extract2; |
||||||
|
|
||||||
|
splitter3 -> extract3; |
||||||
|
splitter3 -> extract3; |
||||||
|
splitter3 -> extract3; |
||||||
|
|
||||||
|
splitter4 -> extract4; |
||||||
|
splitter4 -> extract4; |
||||||
|
splitter4 -> extract4; |
||||||
|
|
||||||
|
splitter5 -> extract5; |
||||||
|
splitter5 -> extract5; |
||||||
|
splitter5 -> extract5; |
||||||
|
|
||||||
|
splitter6 -> extract6; |
||||||
|
splitter6 -> extract6; |
||||||
|
splitter6 -> extract6; |
||||||
|
|
||||||
|
splitter7 -> extract7; |
||||||
|
splitter7 -> extract7; |
||||||
|
splitter7 -> extract7; |
||||||
|
|
||||||
|
splitter8 -> extract8; |
||||||
|
splitter8 -> extract8; |
||||||
|
splitter8 -> extract8; |
||||||
|
|
||||||
|
splitter9 -> extract9; |
||||||
|
splitter9 -> extract9; |
||||||
|
splitter9 -> extract9; |
||||||
|
|
||||||
|
splitter10 -> extract10; |
||||||
|
splitter10 -> extract10; |
||||||
|
splitter10 -> extract10; |
||||||
|
|
||||||
|
splitter11 -> extract11; |
||||||
|
splitter11 -> extract11; |
||||||
|
splitter11 -> extract11; |
||||||
|
|
||||||
|
splitter12 -> extract12; |
||||||
|
splitter12 -> extract12; |
||||||
|
splitter12 -> extract12; |
||||||
|
|
||||||
|
extract1 -> keyby; |
||||||
|
extract1 -> keyby; |
||||||
|
extract1 -> keyby; |
||||||
|
|
||||||
|
extract2 -> keyby; |
||||||
|
extract2 -> keyby; |
||||||
|
extract2 -> keyby; |
||||||
|
|
||||||
|
extract3 -> keyby; |
||||||
|
extract3 -> keyby; |
||||||
|
extract3 -> keyby; |
||||||
|
|
||||||
|
extract4 -> keyby; |
||||||
|
extract4 -> keyby; |
||||||
|
extract4 -> keyby; |
||||||
|
|
||||||
|
extract5 -> keyby; |
||||||
|
extract5 -> keyby; |
||||||
|
extract5 -> keyby; |
||||||
|
|
||||||
|
extract6 -> keyby; |
||||||
|
extract6 -> keyby; |
||||||
|
extract6 -> keyby; |
||||||
|
|
||||||
|
extract7 -> keyby; |
||||||
|
extract7 -> keyby; |
||||||
|
extract7 -> keyby; |
||||||
|
|
||||||
|
extract8 -> keyby; |
||||||
|
extract8 -> keyby; |
||||||
|
extract8 -> keyby; |
||||||
|
|
||||||
|
extract9 -> keyby; |
||||||
|
extract9 -> keyby; |
||||||
|
extract9 -> keyby; |
||||||
|
|
||||||
|
extract10 -> keyby; |
||||||
|
extract10 -> keyby; |
||||||
|
extract10 -> keyby; |
||||||
|
|
||||||
|
extract11 -> keyby; |
||||||
|
extract11 -> keyby; |
||||||
|
extract11 -> keyby; |
||||||
|
|
||||||
|
extract12 -> keyby; |
||||||
|
extract12 -> keyby; |
||||||
|
extract12 -> keyby; |
||||||
|
|
||||||
|
keyby -> window1; |
||||||
|
keyby -> window2; |
||||||
|
keyby -> window3; |
||||||
|
keyby -> window4; |
||||||
|
keyby -> window5; |
||||||
|
keyby -> window6; |
||||||
|
keyby -> window7; |
||||||
|
keyby -> window8; |
||||||
|
keyby -> window9; |
||||||
|
keyby -> window10; |
||||||
|
keyby -> window11; |
||||||
|
keyby -> window12; |
||||||
|
|
||||||
|
window1 -> reduce1; |
||||||
|
window2 -> reduce2; |
||||||
|
window3 -> reduce3; |
||||||
|
window4 -> reduce4; |
||||||
|
window5 -> reduce5; |
||||||
|
window6 -> reduce6; |
||||||
|
window7 -> reduce7; |
||||||
|
window8 -> reduce8; |
||||||
|
window9 -> reduce9; |
||||||
|
window10 -> reduce10; |
||||||
|
window11 -> reduce11; |
||||||
|
window12 -> reduce12; |
||||||
|
|
||||||
|
reduce1 -> sink1; |
||||||
|
reduce2 -> sink2; |
||||||
|
reduce3 -> sink3; |
||||||
|
reduce4 -> sink4; |
||||||
|
reduce5 -> sink5; |
||||||
|
reduce6 -> sink6; |
||||||
|
reduce7 -> sink7; |
||||||
|
reduce8 -> sink8; |
||||||
|
reduce9 -> sink9; |
||||||
|
reduce10 -> sink10; |
||||||
|
reduce11 -> sink11; |
||||||
|
reduce12 -> sink12; |
||||||
|
} |
@ -0,0 +1 @@ |
|||||||
|
<mxfile userAgent="Mozilla/5.0 (Macintosh; Intel Mac OS X 10.13; rv:59.0) Gecko/20100101 Firefox/59.0" version="8.5.0" editor="www.draw.io" type="device"><diagram id="7fd0e512-99a9-914d-b755-72f1f563e955" name="Page-1">5Zpdb5swFIZ/DbcT2BDCZZt1282kSb1Yd+mBC1YNjhynSffrZ8Dmy0RCFTCPchN8bPzxnFfHPgQHHvLrV46O2XeWYOoAN7k68LMDgAfgXv6UlrfastuHtSHlJFGNWsMj+YOV0VXWM0nwqddQMEYFOfaNMSsKHIueDXHOLv1mz4z2Rz2iFBuGxxhR0/qTJCKrrfvAbe3fMEkzPbLnqprfKH5JOTsXajwHwOfqqqtzpPtS7U8ZStilY4IPDjxwxkR9l18PmJZsNbb6uS83apt5c1yIKQ8oP70iesZ6xtW8xJtmUa0Gl+1dB95fMiLw4xHFZe1Fel/aMpFTWfLkbcxyEqv7k+DsBR8YZbzqCUbV1dRoslBa1DQwF/h6cyleA0gKD7McC/4mm6gHfDeoH1GaCxXiS+vASJmyru+gMiKlmbTpueUmbxS6cYyRgdGTq7rTqujQlOsTfWR9TAUrZMv7Z0LpwIQoSQtZjCUPLO33JS0iNXunKnKSJOUwoz7qe7HrphnQw6CPfmei90fQgxnIe952FQzcFSXsge2ChHBNkNAMBv4HDgZetGI08E32wQdmD8GK7AOT/e4Ds/eDFdnvFgre7ljwdqvLCN4zcdSMbp8lmn2xi9GfA2O4WYzeyFliOY5LpRUWcPTX5GjmFZvhuF+Row6xG+QIRnb45TgulWxZwHHNfUZj2yBHuOY+A8xUazMc19xngJk2bYbjqvuMmQJthaO/6j4z4RyOi+SufNMvSzFFp1PJycwou1DwlYinzv2vEuynoCwVcoJPinNVaOvqgXFi/GEwACknx848bjPfyiYQT7Fqth/n3QEajPDUNo4pEuS1P4sxyGqEH4zI+bXuBIPzVzDwUz179VTrKrOjcNCRO+ioXrLRUeXzZtnTZDAhjbBcBqFlMmj6Ud6L3qmC0B2oAAaLqWBCEmS5CvamCrwb0fffyMB48W2hDvQU/2MdRJZHAy+cSQZgt5wMJuSgdstA78T2hoPmOwybw8GEHNpyHegvW+zVwXsPiWvGgwnvACzXAbBeB3MdE5fUwYR3GJbrAI7oANikAzjXMXFJHUx4B2O5DnzrdTDXORFGy+lgwl/ilusgMHVgVbrgz3VMnE8Gsth+PFs3b79Qhg9/AQ==</diagram></mxfile> |
@ -0,0 +1,502 @@ |
|||||||
|
<!doctype html> |
||||||
|
<html lang="en"> |
||||||
|
<head> |
||||||
|
<meta charset="utf-8"> |
||||||
|
|
||||||
|
<title>Mr Banks -- Ou Como Aprendi a Parar de Me Preocupar e Amar o Stream Processing</title> |
||||||
|
|
||||||
|
<meta name="description" content="Colocando uma aplicação Flask em produção em 40 minutos (ou menos)"> |
||||||
|
<meta name="author" content="Julio Biason"> |
||||||
|
|
||||||
|
<meta name="apple-mobile-web-app-capable" content="yes"> |
||||||
|
<meta name="apple-mobile-web-app-status-bar-style" content="black-translucent"> |
||||||
|
|
||||||
|
<meta name="viewport" content="width=device-width, initial-scale=1.0, maximum-scale=1.0, user-scalable=no, minimal-ui"> |
||||||
|
|
||||||
|
<link rel="stylesheet" href="reveal.js/css/reveal.css"> |
||||||
|
<link rel="stylesheet" href="theme/azion.css" id="theme"> |
||||||
|
|
||||||
|
<!-- Code syntax highlighting --> |
||||||
|
<link rel="stylesheet" href="reveal.js/lib/css/zenburn.css"> |
||||||
|
|
||||||
|
<!-- Printing and PDF exports --> |
||||||
|
<script> |
||||||
|
var link = document.createElement( 'link' ); |
||||||
|
link.rel = 'stylesheet'; |
||||||
|
link.type = 'text/css'; |
||||||
|
link.href = window.location.search.match( /print-pdf/gi ) ? 'css/print/pdf.css' : 'css/print/paper.css'; |
||||||
|
document.getElementsByTagName( 'head' )[0].appendChild( link ); |
||||||
|
</script> |
||||||
|
|
||||||
|
<!--[if lt IE 9]> |
||||||
|
<script src="lib/js/html5shiv.js"></script> |
||||||
|
<![endif]--> |
||||||
|
|
||||||
|
<style type="text/css" media="screen"> |
||||||
|
.happy { |
||||||
|
color: yellow; |
||||||
|
} |
||||||
|
|
||||||
|
.reveal section img { |
||||||
|
border: none; |
||||||
|
} |
||||||
|
|
||||||
|
.reveal ul.empty { |
||||||
|
list-style: none outside; |
||||||
|
} |
||||||
|
|
||||||
|
li { |
||||||
|
display: block; |
||||||
|
} |
||||||
|
|
||||||
|
.cursor { |
||||||
|
background-color: #666; |
||||||
|
color: white; |
||||||
|
} |
||||||
|
|
||||||
|
img { |
||||||
|
max-height: 90%; |
||||||
|
} |
||||||
|
</style> |
||||||
|
</head> |
||||||
|
|
||||||
|
<body> |
||||||
|
<div class="reveal"> |
||||||
|
<div class="slides"> |
||||||
|
<section> |
||||||
|
<section data-background="_images/unclephil.jpg"> |
||||||
|
<h1 class="semi-opaque"> |
||||||
|
Mr Banks |
||||||
|
<small class="fragment">Ou Como Aprendi a Parar de Me Preocupar e Amar o Stream Processing </small> |
||||||
|
</h1> |
||||||
|
</section> |
||||||
|
</section> |
||||||
|
|
||||||
|
<section> |
||||||
|
<section> |
||||||
|
<h2>Batch Processing</h2> |
||||||
|
|
||||||
|
<pre><code> |
||||||
|
cat /var/log/messages | cut -d\ -f 1 | sort | uniq |
||||||
|
</code></pre> |
||||||
|
</section> |
||||||
|
|
||||||
|
<section> |
||||||
|
<h2>Batch Processing</h2> |
||||||
|
|
||||||
|
<pre><code> |
||||||
|
v5 2017-10-17T11:09:59+00:00 7695w 27695w |
||||||
|
1462530548 ha 1441740010 servico.clubeportoseguro.com.br |
||||||
|
0.064 GET BYPASS 200 - 200 1199 http |
||||||
|
/api/produto - - |
||||||
|
application/json; charset=utf-8 HTTP/1.1 |
||||||
|
230 1205 0.047 0.064 0.064 8000 |
||||||
|
200.230.226.125 17759 - - - - - |
||||||
|
- - Jakarta Commons-HttpClient/3.1 - - - |
||||||
|
</code></pre> |
||||||
|
|
||||||
|
<aside class="notes"> |
||||||
|
Esse é uma linha de exemplo dos nossos logs. |
||||||
|
|
||||||
|
Um dos nossos serviços, o Monkeys Collect, captura pacotes de |
||||||
|
2000 dessas linhas e coloca no Kafka. |
||||||
|
</aside> |
||||||
|
</section> |
||||||
|
|
||||||
|
<section> |
||||||
|
<h2>Batch Processing</h2> |
||||||
|
|
||||||
|
<ul> |
||||||
|
<li>Campos são nomeados</li> |
||||||
|
<li>É verificado o status do cache (hit, miss, updating, bypass)</li> |
||||||
|
<li>É calculado a banda utilizada (do usuário pra edge, da edge pra origem, da origem de volta pra edge, e da edge pro usuário)</li> |
||||||
|
<li>Dados são agrupados por cliente, produto e janela de tempo</li> |
||||||
|
</ul> |
||||||
|
</section> |
||||||
|
|
||||||
|
<section> |
||||||
|
<h2>Batch Processing</h2> |
||||||
|
|
||||||
|
<pre><code> |
||||||
|
#!/usr/bin/env python |
||||||
|
# -*- encoding: utf-8 -*-o |
||||||
|
|
||||||
|
import collections |
||||||
|
|
||||||
|
|
||||||
|
def default_data(): |
||||||
|
return { |
||||||
|
'requests': 0, |
||||||
|
'user_to_edge': 0, |
||||||
|
'edge_to_origin': 0, |
||||||
|
'origin_to_edge': 0, |
||||||
|
'edge_to_user': 0, |
||||||
|
'client': '', |
||||||
|
'time': '' |
||||||
|
} |
||||||
|
|
||||||
|
|
||||||
|
def to_bytes(string): |
||||||
|
value = 0 |
||||||
|
for val1 in string.split(','): |
||||||
|
for val2 in val1.split(':'): |
||||||
|
if val2 != '-': |
||||||
|
value += int(val2) |
||||||
|
return value |
||||||
|
|
||||||
|
|
||||||
|
def main(): |
||||||
|
clients = collections.defaultdict(default_data) |
||||||
|
with open('v5sample1.log') as content: |
||||||
|
for line in content: |
||||||
|
line = line.split('\t') |
||||||
|
time = line[1] |
||||||
|
client_id = line[2] |
||||||
|
client = client_id + time[:16] |
||||||
|
upstream_cache_status = line[10].lower() |
||||||
|
upstream_bytes_received = to_bytes(line[14]) |
||||||
|
request_length = to_bytes(line[21]) |
||||||
|
bytes_sent = to_bytes(line[22]) |
||||||
|
|
||||||
|
clients[client]['requests'] += 1 |
||||||
|
clients[client]['user_to_edge'] += request_length |
||||||
|
clients[client]['edge_to_origin'] += request_length \ |
||||||
|
if upstream_cache_status not in ['hit', 'updating'] \ |
||||||
|
else 0 |
||||||
|
|
||||||
|
clients[client]['origin_to_edge'] += upstream_bytes_received |
||||||
|
clients[client]['edge_to_user'] += bytes_sent |
||||||
|
clients[client]['client'] = client_id |
||||||
|
clients[client]['time'] = 'at11_{min}'.format(min=time[14:16]) |
||||||
|
|
||||||
|
if __name__ == "__main__": |
||||||
|
main() |
||||||
|
</code></pre> |
||||||
|
</section> |
||||||
|
|
||||||
|
<section> |
||||||
|
<h2>Batch Processing</h2> |
||||||
|
|
||||||
|
<p>Ou seja, se pegássemos cada arquivo e processássemos |
||||||
|
linha por linha, teríamos um batch processing.</p> |
||||||
|
</section> |
||||||
|
|
||||||
|
<section> |
||||||
|
<h2>Batch Processing</h2> |
||||||
|
|
||||||
|
<p>Problemas:</p> |
||||||
|
|
||||||
|
<ul> |
||||||
|
<li class="fragment">Os logs não param.</li> |
||||||
|
<li class="fragment">São ~25 arquivos/segundo gerados pela CDN. <span class="fragment">(Só HTTP)</span></li> |
||||||
|
<li class="fragment">Cada arquivo é de uma máquina, não o agregado geral.</li> |
||||||
|
<li class="fragment">"Event time" vs "Processing Time"</li> |
||||||
|
</ul> |
||||||
|
</section> |
||||||
|
</section> |
||||||
|
|
||||||
|
<section> |
||||||
|
<section> |
||||||
|
<h2>"Os logs não param"</h2> |
||||||
|
|
||||||
|
<img src="_images/unclephil-nonstop.gif" height="200px" style="float:right" alt="The logs never stop"/> |
||||||
|
|
||||||
|
<p class="fragment">Kafka</p> |
||||||
|
|
||||||
|
<img class="fragment" src="_images/unclephil-kafka.png" alt="A simple representation of Kafka" /> |
||||||
|
</section> |
||||||
|
|
||||||
|
<section> |
||||||
|
<p>"São ~25 arquivos/segundo gerados pela CDN."</p> |
||||||
|
|
||||||
|
<p>"Cada arquivo é de uma máquina, não o agregado geral."</p> |
||||||
|
|
||||||
|
<img class="fragment" src="_images/unclephil-victory.gif" alt="Kafka provides solution for those two too" /> |
||||||
|
</section> |
||||||
|
|
||||||
|
<section> |
||||||
|
<p>Se estamos processando os logs continuamente...</p> |
||||||
|
|
||||||
|
<img class="fragment" src="_images/unclephil-continuous.gif" alt="" /> |
||||||
|
|
||||||
|
<h2 class="fragment">STREAM PROCESSING!</h2> |
||||||
|
</section> |
||||||
|
</section> |
||||||
|
|
||||||
|
<section> |
||||||
|
<section> |
||||||
|
<h2>"Event time" vs "Processing Time"</h2> |
||||||
|
|
||||||
|
<img src="_images/unclephil-time.jpg" height="300px" alt="Taking about Event time vs Processing Time"/> |
||||||
|
</section> |
||||||
|
|
||||||
|
<section> |
||||||
|
<h2>"Event time" vs "Processing Time"</h2> |
||||||
|
|
||||||
|
<ul> |
||||||
|
<li class="fragment">Cada máquina está gerando logs no seu ritmo (máquinas menos acessadas geral logs mais devagar)</li> |
||||||
|
<li class="fragment">Monkeys collect aguarda ter ~2000 linhas para enviar para o Kafka</li> |
||||||
|
<li class="fragment">Mensagens tem que chegar ao Kafka e então serem processadas</li> |
||||||
|
<li class="fragment"><code>v5 2017-10-17T11:09:59+00:00</code></li> |
||||||
|
</ul> |
||||||
|
</section> |
||||||
|
|
||||||
|
<section> |
||||||
|
<h2>"Event time" vs "Processing Time"</h2> |
||||||
|
|
||||||
|
<p>Processing time: A hora que o evento foi <i>processado</i>.</p> |
||||||
|
<p>Event time: A hora que o event foi <i>gerado</i>.</p> |
||||||
|
</section> |
||||||
|
</section> |
||||||
|
|
||||||
|
<section> |
||||||
|
<section> |
||||||
|
<h2>Flink</h2> |
||||||
|
|
||||||
|
<img src="_images/unclephil-kafkaflink.png" alt="A representation of flink consuming kafka events"/> |
||||||
|
</section> |
||||||
|
|
||||||
|
<section> |
||||||
|
<h2>Flink</h2> |
||||||
|
|
||||||
|
<ul> |
||||||
|
<li>Window: janela de tempo, com um período definido (1h, 1min).</li> |
||||||
|
<li>Watermark: tempo a partir da criação da janela para começar a despejar os dados.</li> |
||||||
|
<li>Lateness: tempo em que a janela permanece em memória.</li> |
||||||
|
<li>Late arrivals: eventos que surgem depois que a janela foi removida.</li> |
||||||
|
</ul> |
||||||
|
</section> |
||||||
|
|
||||||
|
<section data-transition="fade"> |
||||||
|
<h2>Flink</h2> |
||||||
|
|
||||||
|
<img src="_images/unclephil-step0.png" alt=""/> |
||||||
|
</section> |
||||||
|
|
||||||
|
<section data-transition="fade"> |
||||||
|
<h2>Flink</h2> |
||||||
|
|
||||||
|
<img src="_images/unclephil-step1.png" alt=""/> |
||||||
|
</section> |
||||||
|
|
||||||
|
<section data-transition="fade"> |
||||||
|
<h2>Flink</h2> |
||||||
|
|
||||||
|
<img src="_images/unclephil-step2.png" alt=""/> |
||||||
|
</section> |
||||||
|
|
||||||
|
<section data-transition="fade"> |
||||||
|
<h2>Flink</h2> |
||||||
|
|
||||||
|
<img src="_images/unclephil-step3.png" alt=""/> |
||||||
|
</section> |
||||||
|
|
||||||
|
<section data-transition="fade"> |
||||||
|
<h2>Flink</h2> |
||||||
|
|
||||||
|
<img src="_images/unclephil-step4.png" alt=""/> |
||||||
|
</section> |
||||||
|
|
||||||
|
<section data-transition="fade"> |
||||||
|
<h2>Flink</h2> |
||||||
|
|
||||||
|
<img src="_images/unclephil-step5.png" alt=""/> |
||||||
|
</section> |
||||||
|
|
||||||
|
<section data-transition="fade"> |
||||||
|
<h2>Flink</h2> |
||||||
|
|
||||||
|
<img src="_images/unclephil-step6.png" alt=""/> |
||||||
|
</section> |
||||||
|
|
||||||
|
<section data-transition="fade"> |
||||||
|
<h2>Flink</h2> |
||||||
|
|
||||||
|
<img src="_images/unclephil-step7.png" alt=""/> |
||||||
|
</section> |
||||||
|
|
||||||
|
<section data-transition="fade"> |
||||||
|
<h2>Flink</h2> |
||||||
|
|
||||||
|
<img src="_images/unclephil-step8.png" alt=""/> |
||||||
|
</section> |
||||||
|
|
||||||
|
<section data-transition="fade"> |
||||||
|
<h2>Flink</h2> |
||||||
|
|
||||||
|
<img src="_images/unclephil-step9.png" alt=""/> |
||||||
|
</section> |
||||||
|
|
||||||
|
<section data-transition="fade"> |
||||||
|
<h2>Flink</h2> |
||||||
|
|
||||||
|
<img src="_images/unclephil-step10.png" alt=""/> |
||||||
|
</section> |
||||||
|
|
||||||
|
<section> |
||||||
|
<h2>Flink</h2> |
||||||
|
|
||||||
|
<p>"One more thing..."</p> |
||||||
|
|
||||||
|
<img src="_images/unclephil-onemorething.jpg" alt=""/> |
||||||
|
</section> |
||||||
|
|
||||||
|
<section> |
||||||
|
<h2>Flink</h2> |
||||||
|
|
||||||
|
<p> |
||||||
|
Uma coisa que eu não mencionei: Não são todos os dados |
||||||
|
passados para as janelas; dados são agrupados e então |
||||||
|
passados para as janelas. |
||||||
|
</p> |
||||||
|
</section> |
||||||
|
</section> |
||||||
|
|
||||||
|
<section> |
||||||
|
<section> |
||||||
|
<h2>Mr Banks</h2> |
||||||
|
|
||||||
|
<img src="_images/unclephil-mrbanks.gif" alt=""/> |
||||||
|
</section> |
||||||
|
|
||||||
|
<section> |
||||||
|
<h2>Mr Banks</h2> |
||||||
|
|
||||||
|
<pre><code>source |
||||||
|
.filter(new Selector(processor)).name(s"Selecting ${processor * 100}% messages") |
||||||
|
.process(new ProcessMessages(brokenMessageTag)).name("Message Processor") |
||||||
|
.flatMap(new MessageSpliter).name("Get Logs") // get the lines in the message |
||||||
|
.filter(new LogBrokenFilter).name("Remove broken logs") |
||||||
|
.filter(new MissingClientFilter).name("Remove logs without clients") |
||||||
|
.flatMap(new MetricExtractor).name("Create metrics") |
||||||
|
.assignTimestampsAndWatermarks(new MetricTimestampAndWatermarks(watermarkTime)).name("Watermark") |
||||||
|
.keyBy(_.key) |
||||||
|
.window(TumblingEventTimeWindows.of(windowTime)) |
||||||
|
.allowedLateness(latenessTime) |
||||||
|
.sideOutputLateData(lateMessageTag) |
||||||
|
.reduce(new MetricReducer(), new MetricWindowTimeMatcher()).name("Group metrics") |
||||||
|
</code></pre> |
||||||
|
</section> |
||||||
|
|
||||||
|
<section> |
||||||
|
<h2>Mr Banks</h2> |
||||||
|
|
||||||
|
<pre><code>.filter(new Selector(processor)).name(s"Selecting ${processor * 100}% messages")</code></pre> |
||||||
|
</section> |
||||||
|
|
||||||
|
<section> |
||||||
|
<h2>Mr Banks</h2> |
||||||
|
|
||||||
|
<pre><code>.process(new ProcessMessages(brokenMessageTag)).name("Message Processor")</code></pre> |
||||||
|
</section> |
||||||
|
|
||||||
|
<section> |
||||||
|
<h2>Mr Banks</h2> |
||||||
|
|
||||||
|
<pre><code>.flatMap(new MessageSpliter).name("Get Logs")</code></pre> |
||||||
|
</section> |
||||||
|
|
||||||
|
<section> |
||||||
|
<h2>Mr Banks</h2> |
||||||
|
|
||||||
|
<pre><code>.filter(new LogBrokenFilter).name("Remove broken logs")</code></pre> |
||||||
|
</section> |
||||||
|
|
||||||
|
<section> |
||||||
|
<h2>Mr Banks</h2> |
||||||
|
|
||||||
|
<pre><code>.filter(new MissingClientFilter).name("Remove logs without clients")</code></pre> |
||||||
|
</section> |
||||||
|
|
||||||
|
<section> |
||||||
|
<h2>Mr Banks</h2> |
||||||
|
|
||||||
|
<pre><code>.flatMap(new MetricExtractor).name("Create metrics")</code></pre> |
||||||
|
</section> |
||||||
|
|
||||||
|
<section> |
||||||
|
<h2>Mr Banks</h2> |
||||||
|
|
||||||
|
<pre><code>.assignTimestampsAndWatermarks(new MetricTimestampAndWatermarks(watermarkTime)).name("Watermark")</code></pre> |
||||||
|
</section> |
||||||
|
|
||||||
|
<section> |
||||||
|
<h2>Mr Banks</h2> |
||||||
|
|
||||||
|
<pre><code>.keyBy(_.key)</code></pre> |
||||||
|
</section> |
||||||
|
|
||||||
|
<section> |
||||||
|
<h2>Mr Banks</h2> |
||||||
|
|
||||||
|
<pre><code>.window(TumblingEventTimeWindows.of(windowTime))</code></pre> |
||||||
|
</section> |
||||||
|
|
||||||
|
<section> |
||||||
|
<h2>Mr Banks</h2> |
||||||
|
|
||||||
|
<pre><code>.allowedLateness(latenessTime)</code></pre> |
||||||
|
</section> |
||||||
|
|
||||||
|
<section> |
||||||
|
<h2>Mr Banks</h2> |
||||||
|
|
||||||
|
<pre><code>.sideOutputLateData(lateMessageTag)</code></pre> |
||||||
|
</section> |
||||||
|
|
||||||
|
<section> |
||||||
|
<h2>Mr Banks</h2> |
||||||
|
|
||||||
|
<pre><code>.reduce(new MetricReducer(), new MetricWindowTimeMatcher()).name("Group metrics")</code></pre> |
||||||
|
</section> |
||||||
|
|
||||||
|
<section> |
||||||
|
<h2>Mr Banks</h2> |
||||||
|
|
||||||
|
<img src="_images/unclephil-flinkpipeline.png" alt=""/> |
||||||
|
</section> |
||||||
|
|
||||||
|
<section> |
||||||
|
<h2>Mr Banks</h2> |
||||||
|
|
||||||
|
<img src="_images/unclephil-flinkpipelinereal.png" alt=""/> |
||||||
|
</section> |
||||||
|
</section> |
||||||
|
|
||||||
|
<section data-background='_images/thats-all-folks.jpg'> |
||||||
|
<section> |
||||||
|
<h1 class="fragment semi-opaque">Perguntas?</h1> |
||||||
|
</section> |
||||||
|
</section> |
||||||
|
</div> |
||||||
|
</div> |
||||||
|
|
||||||
|
<script src="reveal.js/lib/js/head.min.js"></script> |
||||||
|
<script src="reveal.js/js/reveal.js"></script> |
||||||
|
|
||||||
|
<script> |
||||||
|
// Full list of configuration options available at: |
||||||
|
// https://github.com/hakimel/reveal.js#configuration |
||||||
|
Reveal.initialize({ |
||||||
|
controls: true, |
||||||
|
progress: true, |
||||||
|
history: true, |
||||||
|
center: true, |
||||||
|
// showNotes: true, |
||||||
|
|
||||||
|
transition: 'slide', // none/fade/slide/convex/concave/zoom |
||||||
|
|
||||||
|
// Optional reveal.js plugins |
||||||
|
dependencies: [ |
||||||
|
{ src: 'reveal.js/lib/js/classList.js', condition: function() { return !document.body.classList; } }, |
||||||
|
{ src: 'reveal.js/plugin/markdown/marked.js', condition: function() { return !!document.querySelector( '[data-markdown]' ); } }, |
||||||
|
{ src: 'reveal.js/plugin/markdown/markdown.js', condition: function() { return !!document.querySelector( '[data-markdown]' ); } }, |
||||||
|
{ src: 'reveal.js/plugin/highlight/highlight.js', async: true, callback: function() { hljs.initHighlightingOnLoad(); } }, |
||||||
|
{ src: 'reveal.js/plugin/zoom-js/zoom.js', async: true }, |
||||||
|
{ src: 'reveal.js/plugin/notes/notes.js', async: true } |
||||||
|
] |
||||||
|
}); |
||||||
|
</script> |
||||||
|
|
||||||
|
</body> |
||||||
|
</html> |