<?xml version="1.0" encoding="UTF-8"?>
<rss version="2.0"
	xmlns:content="http://purl.org/rss/1.0/modules/content/"
	xmlns:wfw="http://wellformedweb.org/CommentAPI/"
	xmlns:dc="http://purl.org/dc/elements/1.1/"
	xmlns:atom="http://www.w3.org/2005/Atom"
	xmlns:sy="http://purl.org/rss/1.0/modules/syndication/"
	xmlns:slash="http://purl.org/rss/1.0/modules/slash/"
	>

<channel>
	<title>Oduvan's Web Blog</title>
	<atom:link href="http://www.lyabah.com/index.php/feed/" rel="self" type="application/rss+xml" />
	<link>http://www.lyabah.com</link>
	<description></description>
	<lastBuildDate>Tue, 24 Apr 2012 08:22:01 +0000</lastBuildDate>
	<generator>http://wordpress.org/?v=2.9.2</generator>
	<language>en</language>
	<sy:updatePeriod>hourly</sy:updatePeriod>
	<sy:updateFrequency>1</sy:updateFrequency>
			<item>
		<title>Некрасивая девочка</title>
		<link>http://www.lyabah.com/index.php/2012/04/24/girl/</link>
		<comments>http://www.lyabah.com/index.php/2012/04/24/girl/#comments</comments>
		<pubDate>Tue, 24 Apr 2012 08:22:01 +0000</pubDate>
		<dc:creator>Oduvan</dc:creator>
				<category><![CDATA[Internet]]></category>

		<guid isPermaLink="false">http://www.lyabah.com/?p=1145</guid>
		<description><![CDATA[Перепост отсюда. http://web-brains.com/2010/04/08/kak-krasivo/ Как красиво  

Среди других играющих детей
Она напоминает лягушонка.
Заправлена в трусы худая рубашонка,
Колечки рыжеватые кудрей
Рассыпаны, рот длинен, зубки кривы,
Черты лица остры и некрасивы.
Двум мальчуганам, сверстникам её,
Отцы купили по велосипеду.
Сегодня мальчики, не торопясь к обеду,
Гоняют по двору, забывши про неё,
Она ж за ними бегает по следу.
Чужая радость так же, как своя,
Томит её и [...]]]></description>
			<content:encoded><![CDATA[<p>Перепост отсюда. http://web-brains.com/2010/04/08/kak-krasivo/ Как красиво <img src='http://www.lyabah.com/wp-includes/images/smilies/icon_smile.gif' alt=':)' class='wp-smiley' /> </p>
<pre>
Среди других играющих детей
Она напоминает лягушонка.
Заправлена в трусы худая рубашонка,
Колечки рыжеватые кудрей
Рассыпаны, рот длинен, зубки кривы,
Черты лица остры и некрасивы.
Двум мальчуганам, сверстникам её,
Отцы купили по велосипеду.
Сегодня мальчики, не торопясь к обеду,
Гоняют по двору, забывши про неё,
Она ж за ними бегает по следу.
Чужая радость так же, как своя,
Томит её и вон из сердца рвётся,
И девочка ликует и смеётся,
Охваченная счастьем бытия.

Ни тени зависти, ни умысла худого
Ещё не знает это существо.
Ей всё на свете так безмерно ново,
Так живо всё, что для иных мертво!
И не хочу я думать, наблюдая,
Что будет день, когда она, рыдая,
Увидит с ужасом, что посреди подруг
Она всего лишь бедная дурнушка!
Мне верить хочется, что сердце не игрушка,
Сломать его едва ли можно вдруг!
Мне верить хочется, что чистый этот пламень,
Который в глубине её горит,
Всю боль свою один переболит
И перетопит самый тяжкий камень!
И пусть черты её нехороши
И нечем ей прельстить воображенье,-
Младенческая грация души
Уже сквозит в любом её движенье.
А если это так, то что есть красота
И почему её обожествляют люди?
Сосуд она, в котором пустота,
Или огонь, мерцающий в сосуде?
</pre>
]]></content:encoded>
			<wfw:commentRss>http://www.lyabah.com/index.php/2012/04/24/girl/feed/</wfw:commentRss>
		<slash:comments>1</slash:comments>
		</item>
		<item>
		<title>Разыскивается Python Developer в команду</title>
		<link>http://www.lyabah.com/index.php/2012/04/12/looking-for-python-dev/</link>
		<comments>http://www.lyabah.com/index.php/2012/04/12/looking-for-python-dev/#comments</comments>
		<pubDate>Thu, 12 Apr 2012 20:45:29 +0000</pubDate>
		<dc:creator>Oduvan</dc:creator>
				<category><![CDATA[checkio]]></category>
		<category><![CDATA[Work]]></category>

		<guid isPermaLink="false">http://www.lyabah.com/?p=1138</guid>
		<description><![CDATA[
Желательно в офис на полную, Днепропетровск. Но можно и удаленка. Работа над проектом CheckIO.org
Можно писать сюда support@lyabah.com или звонить сюда +380503625288
]]></description>
			<content:encoded><![CDATA[<p><a href="http://www.lyabah.com/wp-content/uploads/2012/04/python_developer.jpg"><img src="http://www.lyabah.com/wp-content/uploads/2012/04/python_developer.jpg" alt="" title="python_developer" width="700" height="525" class="aligncenter size-full wp-image-1139" /></a></p>
<h3>Желательно в офис на полную, Днепропетровск. Но можно и удаленка. Работа над проектом CheckIO.org</p>
<p>Можно писать сюда support@lyabah.com или звонить сюда +380503625288</h3>
]]></content:encoded>
			<wfw:commentRss>http://www.lyabah.com/index.php/2012/04/12/looking-for-python-dev/feed/</wfw:commentRss>
		<slash:comments>7</slash:comments>
		</item>
		<item>
		<title>OneToOne</title>
		<link>http://www.lyabah.com/index.php/2012/04/11/onetoone/</link>
		<comments>http://www.lyabah.com/index.php/2012/04/11/onetoone/#comments</comments>
		<pubDate>Wed, 11 Apr 2012 16:46:22 +0000</pubDate>
		<dc:creator>Oduvan</dc:creator>
				<category><![CDATA[Programming]]></category>
		<category><![CDATA[DB]]></category>
		<category><![CDATA[orm]]></category>

		<guid isPermaLink="false">http://www.lyabah.com/?p=1136</guid>
		<description><![CDATA[Мыль, коротка, убейте критикой.
Ксательно орм и бд.
Если У Вас есть один обхект данных &#8211; например пользователь, который имеет различные свойтства, например имя, баланс, статистика.
То информацию лучше разделять в разных моделях в зависимости от частоты смены смены данных, связных один к одному к друг другу. Или даже в зависимости от уровня досутпа к каждой из них.
Что [...]]]></description>
			<content:encoded><![CDATA[<p>Мыль, коротка, убейте критикой.</p>
<p>Ксательно орм и бд.</p>
<p>Если У Вас есть один обхект данных &#8211; например пользователь, который имеет различные свойтства, например имя, баланс, статистика.</p>
<p>То информацию лучше разделять в разных моделях в зависимости от частоты смены смены данных, связных один к одному к друг другу. Или даже в зависимости от уровня досутпа к каждой из них.</p>
<p>Что скажите? Не понятно?</p>
]]></content:encoded>
			<wfw:commentRss>http://www.lyabah.com/index.php/2012/04/11/onetoone/feed/</wfw:commentRss>
		<slash:comments>3</slash:comments>
		</item>
		<item>
		<title>UCSVLOG and GitHub продолжение</title>
		<link>http://www.lyabah.com/index.php/2012/04/08/ucsvlog-github-2/</link>
		<comments>http://www.lyabah.com/index.php/2012/04/08/ucsvlog-github-2/#comments</comments>
		<pubDate>Sun, 08 Apr 2012 15:40:52 +0000</pubDate>
		<dc:creator>Oduvan</dc:creator>
				<category><![CDATA[UCSVLOG]]></category>
		<category><![CDATA[django]]></category>
		<category><![CDATA[django-ucsvlog]]></category>
		<category><![CDATA[django-ucsvlog-analytics]]></category>
		<category><![CDATA[Python]]></category>
		<category><![CDATA[python-ucsvlog]]></category>
		<category><![CDATA[ucsvlog]]></category>

		<guid isPermaLink="false">http://www.lyabah.com/?p=1129</guid>
		<description><![CDATA[ django-ucsvlog и django-ucsvlog-analytics также перехали на github. Код там не сильно грязный, но за усердную отчистку и покрытие тестами еще не садился.
у python-ucsvlog небольшое обновлени в формате логов. Т.к. формат строки через &#8220;%&#8221; &#8211; это прошлый век, и format рулит &#8211; темлпейт для имен файлов поменялся, так что теперь файл лога с дневным рендерингом [...]]]></description>
			<content:encoded><![CDATA[<p><a href="http://www.lyabah.com/wp-content/uploads/2012/04/download.jpeg"><img src="http://www.lyabah.com/wp-content/uploads/2012/04/download.jpeg" alt="" title="download" width="266" height="189" class="alignleft size-full wp-image-1123" /></a> <a href="https://github.com/oduvan/django-ucsvlog">django-ucsvlog</a> и <a href="https://github.com/oduvan/django-ucsvlog-analytics">django-ucsvlog-analytics</a> также перехали на github. Код там не сильно грязный, но за усердную отчистку и покрытие тестами еще не садился.</p>
<p>у python-ucsvlog небольшое обновлени в формате логов. Т.к. формат строки через &#8220;%&#8221; &#8211; это прошлый век, и format рулит &#8211; темлпейт для имен файлов поменялся, так что теперь файл лога с дневным рендерингом будет выглядить примерно так /var/log/django/{year}-{month}-{day}.ucsv</p>
]]></content:encoded>
			<wfw:commentRss>http://www.lyabah.com/index.php/2012/04/08/ucsvlog-github-2/feed/</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
		<item>
		<title>UCSVLOG  съехал на GitHub</title>
		<link>http://www.lyabah.com/index.php/2012/04/07/ucsvlog-to-github/</link>
		<comments>http://www.lyabah.com/index.php/2012/04/07/ucsvlog-to-github/#comments</comments>
		<pubDate>Fri, 06 Apr 2012 22:29:20 +0000</pubDate>
		<dc:creator>Oduvan</dc:creator>
				<category><![CDATA[UCSVLOG]]></category>
		<category><![CDATA[logs]]></category>
		<category><![CDATA[pep8]]></category>
		<category><![CDATA[Python]]></category>
		<category><![CDATA[ucsvlog]]></category>

		<guid isPermaLink="false">http://www.lyabah.com/?p=1121</guid>
		<description><![CDATA[По многочисленным заявкам python-ucsvlog переехал на github https://github.com/oduvan/python-ucsvlog
Но не просто переехали, а переехали c почищенным кодом, с коменами, с рефакторингом, оставили только нужное, прибрались в тестах.
Рассчитываю на вашу критику.
ПС: Вот так вот выглядит дифф в пеп8  
]]></description>
			<content:encoded><![CDATA[<p><img src="http://www.lyabah.com/wp-content/uploads/2012/04/download.jpeg" alt="" title="download" width="266" height="189" class="alignleft size-full wp-image-1123" />По многочисленным заявкам python-ucsvlog переехал на github <a href="https://github.com/oduvan/python-ucsvlog">https://github.com/oduvan/python-ucsvlog</a></p>
<p>Но не просто переехали, а переехали c почищенным кодом, с коменами, с рефакторингом, оставили только нужное, прибрались в тестах.</p>
<p>Рассчитываю на вашу критику.</p>
<p>ПС: Вот так вот выглядит дифф в пеп8 <img src='http://www.lyabah.com/wp-includes/images/smilies/icon_smile.gif' alt=':)' class='wp-smiley' /> </p>
]]></content:encoded>
			<wfw:commentRss>http://www.lyabah.com/index.php/2012/04/07/ucsvlog-to-github/feed/</wfw:commentRss>
		<slash:comments>3</slash:comments>
		</item>
		<item>
		<title>Ищу модератора / контент-медежера для проекта CheckIO связаного с python-разработкой</title>
		<link>http://www.lyabah.com/index.php/2012/04/05/checkio-moderator/</link>
		<comments>http://www.lyabah.com/index.php/2012/04/05/checkio-moderator/#comments</comments>
		<pubDate>Thu, 05 Apr 2012 11:00:41 +0000</pubDate>
		<dc:creator>Oduvan</dc:creator>
				<category><![CDATA[checkio]]></category>
		<category><![CDATA[Work]]></category>

		<guid isPermaLink="false">http://www.lyabah.com/?p=1111</guid>
		<description><![CDATA[
Главное, чтоб был хороший и добрый  
Знания ангийского &#8211; ОК, знания python &#8211; ОК. Но главное чтобы был хороший&#8230;. и добрый&#8230;
Оплата договорная после собеседования. Рабоать можно как удаленно,  так и в офисе Днепропетровск, Украина, так и парттайм  
Можно писать, а можно звонить +380503625288
]]></description>
			<content:encoded><![CDATA[<p><img src="http://www.lyabah.com/wp-content/uploads/2012/04/Moderator.jpg" alt="" title="Moderator" width="300" height="278" class="alignleft size-full wp-image-1112" /></p>
<p>Главное, чтоб был хороший и добрый <img src='http://www.lyabah.com/wp-includes/images/smilies/icon_smile.gif' alt=':)' class='wp-smiley' /> </p>
<p>Знания ангийского &#8211; ОК, знания python &#8211; ОК. Но главное чтобы был хороший&#8230;. и добрый&#8230;</p>
<p>Оплата договорная после собеседования. Рабоать можно как удаленно,  так и в офисе Днепропетровск, Украина, так и парттайм <img src='http://www.lyabah.com/wp-includes/images/smilies/icon_smile.gif' alt=':)' class='wp-smiley' /> </p>
<p>Можно писать, а можно звонить +380503625288</p>
]]></content:encoded>
			<wfw:commentRss>http://www.lyabah.com/index.php/2012/04/05/checkio-moderator/feed/</wfw:commentRss>
		<slash:comments>6</slash:comments>
		</item>
		<item>
		<title>UCSVLOG</title>
		<link>http://www.lyabah.com/index.php/2012/04/04/ucsvlog-2/</link>
		<comments>http://www.lyabah.com/index.php/2012/04/04/ucsvlog-2/#comments</comments>
		<pubDate>Tue, 03 Apr 2012 22:44:48 +0000</pubDate>
		<dc:creator>Oduvan</dc:creator>
				<category><![CDATA[UCSVLOG]]></category>
		<category><![CDATA[dneprpy]]></category>
		<category><![CDATA[kyivpy]]></category>
		<category><![CDATA[Python]]></category>
		<category><![CDATA[ucsvlog]]></category>

		<guid isPermaLink="false">http://www.lyabah.com/?p=1109</guid>
		<description><![CDATA[1ого апреля в Киеве в офисе Ciklum состаялась 6ая KyivPy конференция. На которую я &#8220;пролез&#8221; со своими UCSVLOG. После конфы и общения с людьми я ушел с полной уверенностью в том, что это нужно, и что люди устали от мусора и бесполезности своих логов. Поэтому уже дома я подготовил серию из трех статей о моем [...]]]></description>
			<content:encoded><![CDATA[<p>1ого апреля в Киеве в офисе Ciklum состаялась 6ая KyivPy конференция. На которую я &#8220;пролез&#8221; со своими UCSVLOG. После конфы и общения с людьми я ушел с полной уверенностью в том, что это нужно, и что люди устали от мусора и бесполезности своих логов. Поэтому уже дома я подготовил серию из трех статей о моем докладе на KyivPy</p>
<p><a href="/index.php/2012/04/02/ucsvlog-kyivpy-1/">Часть 1. Проблема и Идея</a> &#8211;  о всех своих негодованиях на тему классических схем ведения логов и идея, как это может быть исправлено</p>
<p><a href="/index.php/2012/04/02/ucsvlog-kyivpy-2/">Часть 2. Решение</a> &#8211; чуть более детально про принципы ведения UCSVLOG</p>
<p><a href="/index.php/2012/04/04/ucsvlog-kyivpy-3/">Часть 3. Плюшки</a> &#8211; Какая функциональная база для аналитики уже голова у нас, и как вы ее можете расширять и использовать.</p>
<p>Видео <a href="http://www.youtube.com/watch?v=CNM4vVD2oj8&#038;feature=youtu.be">Видео, за которое спасибо @Andrew Bananos</a> &#8211; где-то минут 20 сам доклад, и 15 мин ответы на вопросы</p>
<p>Спасибо <a href="http://www.facebook.com/volodymyr">Володе</a> за организацию и за возможность встретиться с людьми, с которыми ты так долго общался в сети. Уже жду следующего пая.</p>
<p>Из проектов в сети по схожей теме стоим обратить внимание не <a href="http://www.splunk.com/product">splunk.com</a> &#8211; спасибо <a href="http://www.facebook.com/max.klymyshyn">Максу</a> за наводку. <a href="http://loggly.com">loggly.com</a> и <a href="http://lucene.apache.org/solr/">Solr от Apache</a> &#8211; спасибо <a href="http://www.facebook.com/profile.php?id=100000436461839">Василию</a> за наводку.</p>
<p>Кста. Харьков, Одесса и Донецк уже организивали свои Py и не по одному разу. Почему Днепр отстает. Если организовывать подобное действо у нас в Днепре &#8211; желающие прийти послушать / рассказать / поглядеть будут?</p>
]]></content:encoded>
			<wfw:commentRss>http://www.lyabah.com/index.php/2012/04/04/ucsvlog-2/feed/</wfw:commentRss>
		<slash:comments>5</slash:comments>
		</item>
		<item>
		<title>UCSVLOG kyivpy#6 &#8211; Как облегчают жизнь качественные логи. Часть 3. Плюшки</title>
		<link>http://www.lyabah.com/index.php/2012/04/04/ucsvlog-kyivpy-3/</link>
		<comments>http://www.lyabah.com/index.php/2012/04/04/ucsvlog-kyivpy-3/#comments</comments>
		<pubDate>Tue, 03 Apr 2012 22:07:30 +0000</pubDate>
		<dc:creator>Oduvan</dc:creator>
				<category><![CDATA[UCSVLOG]]></category>
		<category><![CDATA[analytics]]></category>
		<category><![CDATA[django]]></category>
		<category><![CDATA[logs]]></category>
		<category><![CDATA[Python]]></category>
		<category><![CDATA[ucsvlog]]></category>

		<guid isPermaLink="false">http://www.lyabah.com/?p=1091</guid>
		<description><![CDATA[Продолжаем о UCSVLOG. Начало читайте тут – Часть 1. Проблема и Идея, потом тут мы продолжили &#8211; Часть 2. Решение , ну а сейчас о плюхах 
&#8195;Плюшки это типо сладости, которые тебе дают, если ты прилежно все делаешь. Так и с логами. Если ты правильно и аккуратно их пишешь &#8211; то в результате получаешь правильную [...]]]></description>
			<content:encoded><![CDATA[<p><i>Продолжаем о UCSVLOG. Начало читайте тут – <a href="/index.php/2012/04/02/ucsvlog-kyivpy-1/">Часть 1. Проблема и Идея</a>, потом тут мы продолжили &#8211; <a href="/index.php/2012/04/02/ucsvlog-kyivpy-2/">Часть 2. Решение</a> , ну а сейчас о плюхах </i></p>
<p>&emsp;Плюшки это типо сладости, которые тебе дают, если ты прилежно все делаешь. Так и с логами. Если ты правильно и аккуратно их пишешь &#8211; то в результате получаешь правильную и четкую аналитику любой сложности и не только.</p>
<h3>django-ucsvlog</h3>
<p><i>Проект лежит на <a href="https://bitbucket.org/oduvan/django-ucsvlog">bitbucket.org</a></i></p>
<p>&emsp;Первым для себя применением ucsvlog я нашел в как апой к Django. Он был создан за долго до того, как у Django появились свои логи. И пока миграцию на них я не планирую, а думаю, как объеденить и взять что-то хорошее с джанговских и сделать процесс миграции с джанговских на UCSVLOG более простым. </p>
<p>&emsp;Блоком в данном случае у нас будет запрос пользователя. Подключается с помощью одной или двух мидлварь, каждая из которых открывает блок.</p>
<p>&emsp;Первая  &#8216;djucsvlog.middleware.<b>LogRequestInfo</b>&#8216; идет как самой первой в Вашем списке мидлварь,а значит должна запускаться еще до того, как какая-либо из них начнет работать.</p>
<p>&emsp;Она открывает блок, в который кладется информация о запросе, а в settings  задается список полей которые мы хотим записываться, например имя домена, путь, гет, пост параметры, файлы или BROWSER_UUID_COOKIE. </p>
<p>&emsp;<b>BROWSER_UUID_COOKIE</b> &#8211; это простой механизм, который по средствам кук следит за действиями пользователя. Когда приходит пользователь и у нег нет нашей куки &#8211; мы ему создаем ее и при каждом его запросе кладет ее в лог. Далее это позволит сводить свою аналитику.<br />
Как дополнительная возможность &#8211; это вести лог файлов, которые аплоадит пользователей. Т.е. мы в отдельное место сохраняем все аплоады пользователей, а в логах отмечаем &#8211; что и куда мы сохранено. </p>
<p>&emsp;Вторая &#8216;djucsvlog.middleware.<b>LogViewInfo</b>&#8216;  записывается последней мидлварей, она опциональная, т.е. работать будет и без нее, сюда кладется инфа накопленная с других мидлварь, например информация о залогиненом пользователе или любая другая информация, которая может быть собранная уже с ваших мидлварь.</p>
<p>&emsp;Последнее &#8211; это указать у себя в сетингсах шаблон имени файла <b>UCSVLOG_FILE</b>, и можно начинать играться.</p>
<p>&emsp;Во время работы сам объект логера лежит в глобальной области видимости. Т.е. воспользоваться им можно в любой момент.</p>
<p>&emsp;За время работы с django-ucsvlog у нас накопилось много настроек для кастомизации этих логов. Все они лежат в <b>djucsvlog.settings.py</b> немного документированные, в лучших традициях опенсорса, с указанием дефолтных значений. Такие как &#8211; правило формирования отчет об ексепшене, буферизация,  правило определение IP пользователя, возможность сохранять отдельно загружаемые файлы, а в лог класть инфу о том, куда мы сохранили текущий загруженый файл.<br />
&emsp;+ <b>UCSVLOG_CHANGE_MODEL</b> в этом дикте можно указать &#8211; за изменением каких моделей вы хотите следить ( предварительно указав &#8216;djucsvlog.components.change_model&#8217; в списке компонентов UCSVLOG_COMPONENTS ), и какие поля этих моделей вы хотите класть в лог файл в момент их изменения. Т.е. теперь благодаря логам вы можете связывать изменения любой модели с определенным пользователем &#8211; <b>ваще мечта</b>.</p>
<p>Пример settings.py вашего приложения:</p>
<div class="geshi no python">
<ol>
<li class="li1">
<div class="de1">MIDDLEWARE_CLASSES = <span class="br0">&#40;</span></div>
</li>
<li class="li1">
<div class="de1">&nbsp; &nbsp; <span class="st0">&#39;djucsvlog.middleware.LogRequestInfo&#39;</span>, <span class="co1">##первый</span></div>
</li>
<li class="li1">
<div class="de1">&nbsp; &nbsp; <span class="st0">&#39;django.middleware.common.CommonMiddleware&#39;</span>,</div>
</li>
<li class="li1">
<div class="de1">&nbsp; &nbsp; <span class="st0">&#39;django.contrib.sessions.middleware.SessionMiddleware&#39;</span>,</div>
</li>
<li class="li1">
<div class="de1">&nbsp; &nbsp; <span class="st0">&#39;django.middleware.csrf.CsrfViewMiddleware&#39;</span>,</div>
</li>
<li class="li1">
<div class="de1">&nbsp; &nbsp; <span class="st0">&#39;django.middleware.locale.LocaleMiddleware&#39;</span>,</div>
</li>
<li class="li1">
<div class="de1">&nbsp; &nbsp; <span class="st0">&#39;django.contrib.auth.middleware.AuthenticationMiddleware&#39;</span>,</div>
</li>
<li class="li1">
<div class="de1">&nbsp; &nbsp; <span class="st0">&#39;django.contrib.messages.middleware.MessageMiddleware&#39;</span>,</div>
</li>
<li class="li1">
<div class="de1">&nbsp; &nbsp; <span class="st0">&#39;django.middleware.transaction.TransactionMiddleware&#39;</span>,</div>
</li>
<li class="li1">
<div class="de1">&nbsp; &nbsp; <span class="st0">&#39;djucsvlog.middleware.LogViewInfo&#39;</span>, <span class="co1">## Второй</span></div>
</li>
<li class="li1">
<div class="de1"><span class="br0">&#41;</span></div>
</li>
<li class="li1">
<div class="de1">UCSVLOG_COMPONENTS = <span class="br0">&#40;</span></div>
</li>
<li class="li1">
<div class="de1">&nbsp; &nbsp; &nbsp; &nbsp; <span class="st0">&#39;djucsvlog.components.change_model&#39;</span>,</div>
</li>
<li class="li1">
<div class="de1">&nbsp; &nbsp; <span class="br0">&#41;</span> <span class="co1"># указываем список компонентов ( расширений )</span></div>
</li>
<li class="li1">
<div class="de1">&nbsp;</div>
</li>
<li class="li1">
<div class="de1">UCSVLOG_FILE_VERSION = <span class="st0">&#39;v3&#39;</span> <span class="co1"># о смысле такого хука мы расскажем позже</span></div>
</li>
<li class="li1">
<div class="de1">UCSVLOG_FILE = <span class="st0">&#39;/var/log/django/console-%(year)s-%(month)s-%(day)s-&#39;</span>+UCSVLOG_FILE_VERSION+<span class="st0">&#39;.ucsv&#39;</span></div>
</li>
<li class="li1">
<div class="de1">&nbsp;</div>
</li>
<li class="li1">
<div class="de1"><span class="co1"># &nbsp;По умолчанию False тоже, но если мы хотим, чтоб логи не велись, а выводились в консоль то делаем тру</span></div>
</li>
<li class="li1">
<div class="de1">UCSVLOG_PRINT = <span class="kw2">False</span> </div>
</li>
<li class="li1">
<div class="de1">&nbsp;</div>
</li>
<li class="li1">
<div class="de1"><span class="co1"># Эти поля будут класться в лог в момент закрытия блока запроса, т.е. в самом конце</span></div>
</li>
<li class="li1">
<div class="de1">UCSVLOG_RESPONSE_FIELDS = <span class="br0">&#91;</span><span class="st0">&#39;status&#39;</span>,<span class="st0">&#39;ctype&#39;</span>,<span class="st0">&#39;content&#39;</span><span class="br0">&#93;</span> </div>
</li>
<li class="li1">
<div class="de1">&nbsp;</div>
</li>
<li class="li1">
<div class="de1"><span class="co1"># кастомные пользовательские функции для логирования </span></div>
</li>
<li class="li1">
<div class="de1"><span class="kw1">def</span> server_ip<span class="br0">&#40;</span>request,<span class="sy0">*</span>args,<span class="sy0">**</span>kwargs<span class="br0">&#41;</span>:</div>
</li>
<li class="li1">
<div class="de1">&nbsp; &nbsp; <span class="kw1">return</span> request.<span class="me1">META</span>.<span class="me1">get</span><span class="br0">&#40;</span><span class="st0">&#39;REMOTE_ADDR&#39;</span>, <span class="st0">&#39;0.0.0.0&#39;</span><span class="br0">&#41;</span></div>
</li>
<li class="li1">
<div class="de1">&nbsp;</div>
</li>
<li class="li1">
<div class="de1"><span class="kw1">def</span> ucsvlog_last_login<span class="br0">&#40;</span>request,<span class="sy0">*</span>args,<span class="sy0">**</span>kwargs<span class="br0">&#41;</span>:</div>
</li>
<li class="li1">
<div class="de1">&nbsp; &nbsp; <span class="kw1">return</span> request.<span class="me1">session</span>.<span class="me1">get</span><span class="br0">&#40;</span><span class="st0">&#39;last_login&#39;</span>,<span class="st0">&#39;&#39;</span><span class="br0">&#41;</span></div>
</li>
<li class="li1">
<div class="de1">&nbsp;</div>
</li>
<li class="li1">
<div class="de1"><span class="co1"># поля, которые мы созраняем при открытии реквеста ( в первой мидлвари )</span></div>
</li>
<li class="li1">
<div class="de1">UCSVLOG_REQUEST_FIELDS = <span class="br0">&#91;</span><span class="st0">&#39;http_host&#39;</span>,<span class="st0">&#39;browser_uuid&#39;</span>,<span class="st0">&#39;remote_addr&#39;</span>,server_ip,\</div>
</li>
<li class="li1">
<div class="de1">&nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; <span class="st0">&#39;path&#39;</span>,<span class="st0">&#39;get&#39;</span>,<span class="st0">&#39;post&#39;</span>,<span class="st0">&#39;save_files&#39;</span>,<span class="st0">&#39;http_user_agent&#39;</span>,\</div>
</li>
<li class="li1">
<div class="de1">&nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; <span class="st0">&#39;http_referer&#39;</span>,<span class="st0">&#39;http_accept_language&#39;</span><span class="br0">&#93;</span> </div>
</li>
<li class="li1">
<div class="de1">&nbsp;</div>
</li>
<li class="li1">
<div class="de1">UCSVLOG_VIEW_OPEN_FIELDS = <span class="br0">&#91;</span><span class="st0">&#39;userid&#39;</span>,ucsvlog_last_login<span class="br0">&#93;</span> <span class="co1"># во второй мидлвари</span></div>
</li>
<li class="li1">
<div class="de1">UCSVLOG_RESPONSE_FIELDS = <span class="br0">&#91;</span><span class="st0">&#39;ctype&#39;</span>,<span class="st0">&#39;content&#39;</span>,<span class="st0">&#39;status&#39;</span>,<span class="st0">&#39;headers&#39;</span><span class="br0">&#93;</span> <span class="co1">#при закрытии</span></div>
</li>
<li class="li1">
<div class="de1">UCSVLOG_REQUEST_REQ_REMOTE_ADDR_REAL_IP = <span class="st0">&#39;HTTP_X_REAL_IP&#39;</span></div>
</li>
<li class="li1">
<div class="de1"><span class="co1"># каталог с исходниками, относительно него будет писаться инфа о вызове функций</span></div>
</li>
<li class="li1">
<div class="de1">UCSVLOG_RELATED_FOLDER = PRJ_ROOT</div>
</li>
</ol>
</div>
<p>Большая часть этих настроек имеют значения по умолчанию, поэтому заведется и с такими вот:</p>
<div class="geshi no python">
<ol>
<li class="li1">
<div class="de1">MIDDLEWARE_CLASSES = <span class="br0">&#40;</span></div>
</li>
<li class="li1">
<div class="de1">&nbsp; &nbsp; <span class="st0">&#39;djucsvlog.middleware.LogRequestInfo&#39;</span>, <span class="co1">##первый</span></div>
</li>
<li class="li1">
<div class="de1">&nbsp; &nbsp; <span class="st0">&#39;django.middleware.common.CommonMiddleware&#39;</span>,</div>
</li>
<li class="li1">
<div class="de1">&nbsp; &nbsp; <span class="st0">&#39;django.contrib.sessions.middleware.SessionMiddleware&#39;</span>,</div>
</li>
<li class="li1">
<div class="de1">&nbsp; &nbsp; <span class="st0">&#39;django.middleware.csrf.CsrfViewMiddleware&#39;</span>,</div>
</li>
<li class="li1">
<div class="de1">&nbsp; &nbsp; <span class="st0">&#39;django.middleware.locale.LocaleMiddleware&#39;</span>,</div>
</li>
<li class="li1">
<div class="de1">&nbsp; &nbsp; <span class="st0">&#39;django.contrib.auth.middleware.AuthenticationMiddleware&#39;</span>,</div>
</li>
<li class="li1">
<div class="de1">&nbsp; &nbsp; <span class="st0">&#39;django.contrib.messages.middleware.MessageMiddleware&#39;</span>,</div>
</li>
<li class="li1">
<div class="de1">&nbsp; &nbsp; <span class="st0">&#39;django.middleware.transaction.TransactionMiddleware&#39;</span>,</div>
</li>
<li class="li1">
<div class="de1">&nbsp; &nbsp; <span class="st0">&#39;djucsvlog.middleware.LogViewInfo&#39;</span>, <span class="co1">## Второй</span></div>
</li>
<li class="li1">
<div class="de1"><span class="br0">&#41;</span></div>
</li>
<li class="li1">
<div class="de1">UCSVLOG_FILE = <span class="st0">&#39;/var/log/django/console-%(year)s-%(month)s-%(day)s.ucsv&#39;</span></div>
</li>
</ol>
</div>
<h3>django-ucsvlog-analytics</h3>
<p><i>Проект лежит на <a href="https://bitbucket.org/oduvan/django-ucsvlog-analytics">bitbucket.org</a></i></p>
<p>&emsp;Но все самое вкусное для этих логов, благодаря их хорошей структуризации &#8211; должно лежать в аналитике.<br />
&emsp;Аналитике представленна набором базовых коммнад, которые расширяются исходя из нужд конкретной задачи.<br />
&emsp;Приятной особенностью в написании  логов является то, что на вход функций анализа приходят не массивы, а объекты класса Row , у которого есть множество свойтсв, заполеныне исходя из настроек django-ucsvlog. Т.к. к примеру, когда приходит row из первого индекса реквеста то у него уже есть к примеру аттрибуты row.data_path или row.data_ip<br />
&emsp;Но этот бонус также накладывает и свои ограничения, о которых я расскажу позже.</p>
<h3>BaseSimpleAnalyticCommand &#8211; простой анализатор</h3>
<p>&emsp;Это самый простой метод анализа. Подходит в случае если вы своим логам хотите задать все один и довольно конктерный вопрос. “Дай мне количество хитов за период?” или “Дай мне топ стран”. В этом случае команде кормится набор логфайлов, а в вашу функцию collect_row передаются объекты строк, где вы можете проводить анализ и выдавать пользователю. Тут в принципе ничего сверхествественного не происходит.</p>
<p>&emsp;Вот пример команды, которая собирает из Ваших логов топ accepted languages </p>
<div class="geshi no python">
<ol>
<li class="li1">
<div class="de1"><span class="kw1">from</span> djucsvlog_analytics.<span class="me1">analytic_commands</span> <span class="kw1">import</span> BaseSimpleAnalyticCommand</div>
</li>
<li class="li1">
<div class="de1">&nbsp;</div>
</li>
<li class="li1">
<div class="de1"><span class="kw1">class</span> Command<span class="br0">&#40;</span>BaseSimpleAnalyticCommand<span class="br0">&#41;</span>:</div>
</li>
<li class="li1">
<div class="de1">&nbsp; &nbsp; data = <span class="br0">&#123;</span><span class="br0">&#125;</span></div>
</li>
<li class="li1">
<div class="de1">&nbsp; &nbsp; <span class="co1"># переопределяя эту функцию &#8211; вы указываете,</span></div>
</li>
<li class="li1">
<div class="de1">&nbsp; &nbsp; <span class="co1"># какие записи вы ходите видеть в анализе</span></div>
</li>
<li class="li1">
<div class="de1">&nbsp; &nbsp; <span class="co1"># в нашем случае мы хотим видеть только </span></div>
</li>
<li class="li1">
<div class="de1">&nbsp; &nbsp; <span class="co1"># первые записи блока реквеста,</span></div>
</li>
<li class="li1">
<div class="de1">&nbsp; &nbsp; <span class="co1"># потому что только в них есть инфа о</span></div>
</li>
<li class="li1">
<div class="de1">&nbsp; &nbsp; <span class="co1"># браузере пользователя</span></div>
</li>
<li class="li1">
<div class="de1">&nbsp; &nbsp; <span class="kw1">def</span> filter_row<span class="br0">&#40;</span><span class="kw2">self</span>,row<span class="br0">&#41;</span>:</div>
</li>
<li class="li1">
<div class="de1">&nbsp; &nbsp; &nbsp; &nbsp; <span class="kw1">return</span> row.<span class="me1">is_a_req</span> </div>
</li>
<li class="li1">
<div class="de1">&nbsp; &nbsp; </div>
</li>
<li class="li1">
<div class="de1">&nbsp; &nbsp; <span class="co1"># собственно функция анализа тех записей, которые </span></div>
</li>
<li class="li1">
<div class="de1">&nbsp; &nbsp; <span class="co1"># прошли через фильтер</span></div>
</li>
<li class="li1">
<div class="de1">&nbsp; &nbsp; <span class="kw1">def</span> collect_row<span class="br0">&#40;</span><span class="kw2">self</span>,row<span class="br0">&#41;</span>:</div>
</li>
<li class="li1">
<div class="de1">&nbsp; &nbsp; &nbsp; &nbsp; <span class="kw3">al</span> = row.<span class="me1">data_http_accept_language</span>.\</div>
</li>
<li class="li1">
<div class="de1">&nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp;split<span class="br0">&#40;</span><span class="st0">&#39;;&#39;</span><span class="br0">&#41;</span><span class="br0">&#91;</span><span class="nu0">0</span><span class="br0">&#93;</span>.<span class="me1">split</span><span class="br0">&#40;</span><span class="st0">&#39;,&#39;</span><span class="br0">&#41;</span><span class="br0">&#91;</span><span class="nu0">0</span><span class="br0">&#93;</span>.<span class="me1">split</span><span class="br0">&#40;</span><span class="st0">&#39;-&#39;</span><span class="br0">&#41;</span><span class="br0">&#91;</span><span class="nu0">0</span><span class="br0">&#93;</span></div>
</li>
<li class="li1">
<div class="de1">&nbsp; &nbsp; &nbsp; &nbsp; <span class="kw1">if</span> <span class="kw3">al</span> <span class="kw1">in</span> <span class="kw2">self</span>.<span class="me1">data</span>:</div>
</li>
<li class="li1">
<div class="de1">&nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; <span class="kw2">self</span>.<span class="me1">data</span><span class="br0">&#91;</span><span class="kw3">al</span><span class="br0">&#93;</span>+=<span class="nu0">1</span></div>
</li>
<li class="li1">
<div class="de1">&nbsp; &nbsp; &nbsp; &nbsp; <span class="kw1">else</span>:</div>
</li>
<li class="li1">
<div class="de1">&nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; <span class="kw2">self</span>.<span class="me1">data</span><span class="br0">&#91;</span><span class="kw3">al</span><span class="br0">&#93;</span> = <span class="nu0">1</span></div>
</li>
<li class="li1">
<div class="de1">&nbsp;</div>
</li>
<li class="li1">
<div class="de1">&nbsp; &nbsp; <span class="co1"># и вывод результатов</span></div>
</li>
<li class="li1">
<div class="de1">&nbsp; &nbsp; <span class="kw1">def</span> output_results<span class="br0">&#40;</span><span class="kw2">self</span><span class="br0">&#41;</span>:</div>
</li>
<li class="li1">
<div class="de1">&nbsp; &nbsp; &nbsp; &nbsp; <span class="kw1">for</span> item <span class="kw1">in</span> &nbsp;<span class="kw2">sorted</span><span class="br0">&#40;</span><span class="kw2">self</span>.<span class="me1">data</span>.<span class="me1">items</span><span class="br0">&#40;</span><span class="br0">&#41;</span>,\</div>
</li>
<li class="li1">
<div class="de1">&nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp;key=<span class="kw1">lambda</span> a:a<span class="br0">&#91;</span><span class="nu0">1</span><span class="br0">&#93;</span><span class="br0">&#41;</span>:</div>
</li>
<li class="li1">
<div class="de1">&nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; <span class="kw1">print</span> item<span class="br0">&#91;</span><span class="nu0">0</span><span class="br0">&#93;</span>, item<span class="br0">&#91;</span><span class="nu0">1</span><span class="br0">&#93;</span></div>
</li>
</ol>
</div>
<p>&emsp;Если это сохранить как команду djucsvlog_test_simple_analytics то запуск будет выглядить следующим образом:</p>
<div class="geshi no bash">
<ol>
<li class="li1">
<div class="de1">$ python manage.py djucsvlog_test_simple_analytics <span class="sy0">/</span>var<span class="sy0">/</span>log<span class="sy0">/</span>django<span class="sy0">/</span>stats<span class="nu0">-2012</span><span class="nu0">-3</span><span class="nu0">-21</span>-v3.ucsv &nbsp;&#8211;<span class="re2">settings=</span>settings.analytics</div>
</li>
</ol>
</div>
<h3>djucsvlog_user_path_convertor</h3>
<p>&emsp;Это уже команда на основе базового класса <b>BaseAnalyticCommand ( наследник от BaseSimpleAnalyticCommand )</b>.</p>
<p>&emsp;Очень полезна, когда для одних логов вы хотите провести более детальный анализ. Когда Вам нужен не просто маленький отчет, а когда Вам надо разобраться дельано со сложившейся проблемой с трафиком. Это очень похоже на то, когда трафик есть а продаже нет. Почему?</p>
<p>&emsp;Идея проста convertor собирает из логов sqlite3 БД и кладет в один файл, при этом может дополнить его информацией о браузере, оси и стране пользователя. Таблици внутри него не просто набор строк, а связные таблицы. Хосты имеют много пользователей, пользователи имеют много реквестов, а реквес имеет много лог записей. Сам этот файл уже по сути часть анализа можно просто зайти в нее и на уровне SQL получать необходимые выборки и сводить статистику.</p>
<p>&emsp;djucsvlog_user_path_convertor &#8211; это именно наша идея конвертации в такую вот струкруту БД. Если вы заходите сделать свой конвертато в БД, то просто пишите команду, наследник от BaseAnalyticCommand.</p>
<p>Ниже несколько примеров запуска такой команды в наших проектах</p>
<div class="geshi no bash">
<ol>
<li class="li1">
<div class="de1">$ python manage.py djucsvlog_user_path_convertor <span class="sy0">/</span>var<span class="sy0">/</span>log<span class="sy0">/</span>django<span class="sy0">/*</span> \</div>
</li>
<li class="li1">
<div class="de1">&nbsp; &nbsp; &nbsp; &nbsp; &#8211;<span class="re2">out=</span><span class="sy0">/</span>tmp<span class="sy0">/</span>django.userpath.db</div>
</li>
</ol>
</div>
<p>Это мы просто конвертим все файлы из папки /var/log/django/ в базу</p>
<div class="geshi no bash">
<ol>
<li class="li1">
<div class="de1">$ python manage.py djucsvlog_user_path_convertor <span class="sy0">/</span>var<span class="sy0">/</span>log<span class="sy0">/</span>django<span class="sy0">/*</span> \</div>
</li>
<li class="li1">
<div class="de1">&nbsp; &nbsp; &nbsp; &nbsp; &#8211;<span class="re2">out=</span><span class="sy0">/</span>tmp<span class="sy0">/</span>django.userpath.db &#8211;force-new</div>
</li>
</ol>
</div>
<p>Указываем, что если БД уже есть, то в нее не дописывать а создавать заново</p>
<div class="geshi no bash">
<ol>
<li class="li1">
<div class="de1">$ python manage.py djucsvlog_user_path_convertor <span class="sy0">/</span>var<span class="sy0">/</span>log<span class="sy0">/</span>django<span class="sy0">/*</span> \</div>
</li>
<li class="li1">
<div class="de1">&nbsp; &nbsp; &nbsp; &nbsp; &#8211;<span class="re2">out=</span><span class="sy0">/</span>tmp<span class="sy0">/</span>django.userpath.db &#8211;force-new\</div>
</li>
<li class="li1">
<div class="de1">&nbsp; &nbsp; &nbsp; &nbsp;&#8211;geoip-<span class="re2">db=</span><span class="sy0">/</span>var<span class="sy0">/</span>geodb<span class="sy0">/</span><span class="nu0">2012</span><span class="nu0">-04</span><span class="nu0">-01</span>.db</div>
</li>
</ol>
</div>
<p>Передаем ссылку на  базу GEO IP для добавления дополнительного поля со страной</p>
<h3>djucsvlog_user_path_analytics</h3>
<p>&emsp;Но мы очень быстро поняли, что очень много задач не решаются просто SQL командой, поэтому мы к sqlite3 базе начали дописывать скриптики для ее анализа, и все это свернули в отдельную команды, на вход которой передается один или несколько sqlite файлов и параметры для анализа. Причем параметры разделаются на задачи и на условия. Т.е. мы при вызове команды можем передать ей на вход несколько задач например топ браузеров или топ стран, и условия например пользователи, которые зашли на определенную страницу, пользователи, которые сделали больше определенного количества шагов. Или как связка &#8211; дай мне следующий шаг после переданного.</p>
<p>&emsp;Сама команда является наследником от BaseAnalyticReadCommand, а задачи являются наследниками от BaseAnalyticElement, список условий передаются при создании элемента задачи</p>
<p>&emsp;Ниже несколько примеров использования этой команды:</p>
<div class="geshi no bash">
<ol>
<li class="li1">
<div class="de1">$ python manage.py djucsvlog_user_path_analytics \</div>
</li>
<li class="li1">
<div class="de1">&nbsp; &nbsp; &nbsp; &nbsp; &nbsp;<span class="sy0">/</span>tmp<span class="sy0">/</span>django.userpath.db &#8211;get-entry-points</div>
</li>
</ol>
</div>
<p>Получаем ТОП точек входа на сайт</p>
<div class="geshi no bash">
<ol>
<li class="li1">
<div class="de1">$ python manage.py djucsvlog_user_path_analytics \</div>
</li>
<li class="li1">
<div class="de1">&nbsp; &nbsp; &nbsp; &nbsp; &nbsp;<span class="sy0">/</span>tmp<span class="sy0">/</span>django.userpath.db <span class="sy0">/</span>tmp<span class="sy0">/</span>django_2.userpath.db \</div>
</li>
<li class="li1">
<div class="de1">&nbsp; &nbsp; &nbsp; &nbsp;&#8211;get-entry-points</div>
</li>
</ol>
</div>
<p>Для анализа можно указывать не один файл</p>
<div class="geshi no bash">
<ol>
<li class="li1">
<div class="de1">$ python manage.py djucsvlog_user_path_analytics \</div>
</li>
<li class="li1">
<div class="de1">&nbsp; &nbsp; &nbsp; &nbsp; &nbsp;<span class="sy0">/</span>tmp<span class="sy0">/</span>django.userpath.db <span class="sy0">/</span>tmp<span class="sy0">/</span>django_2.userpath.db \</div>
</li>
<li class="li1">
<div class="de1">&nbsp; &nbsp; &nbsp; &nbsp;&#8211;get-entry-points &#8211;after-<span class="re2">path=</span><span class="sy0">/</span></div>
</li>
</ol>
</div>
<p>Какой был следующий шаг после /</p>
<div class="geshi no bash">
<ol>
<li class="li1">
<div class="de1">$ python manage.py djucsvlog_user_path_analytics \</div>
</li>
<li class="li1">
<div class="de1">&nbsp; &nbsp; &nbsp; &nbsp; &nbsp;<span class="sy0">/</span>tmp<span class="sy0">/</span>django.userpath.db </div>
</li>
<li class="li1">
<div class="de1">&nbsp; &nbsp; &nbsp; &nbsp;&#8211;top<span class="nu0">-404</span></div>
</li>
</ol>
</div>
<p>Невероятно полезная команда после переверстки</p>
<div class="geshi no bash">
<ol>
<li class="li1">
<div class="de1">$ python manage.py djucsvlog_user_path_analytics \</div>
</li>
<li class="li1">
<div class="de1">&nbsp; &nbsp; &nbsp; &nbsp; &nbsp;<span class="sy0">/</span>tmp<span class="sy0">/</span>django.userpath.db </div>
</li>
<li class="li1">
<div class="de1">&nbsp; &nbsp; &nbsp; &nbsp;&#8211;get-country-ip</div>
</li>
</ol>
</div>
<p>Дай топ стран</p>
<div class="geshi no bash">
<ol>
<li class="li1">
<div class="de1">$ python manage.py djucsvlog_user_path_analytics \</div>
</li>
<li class="li1">
<div class="de1">&nbsp; &nbsp; &nbsp; &nbsp; &nbsp;<span class="sy0">/</span>tmp<span class="sy0">/</span>django.userpath.db </div>
</li>
<li class="li1">
<div class="de1">&nbsp; &nbsp; &nbsp; &nbsp;&#8211;get-country-ip &#8211;get-os</div>
</li>
</ol>
</div>
<p>топ стран и топ осей</p>
<div class="geshi no bash">
<ol>
<li class="li1">
<div class="de1">$ python manage.py djucsvlog_user_path_analytics \</div>
</li>
<li class="li1">
<div class="de1">&nbsp; &nbsp; &nbsp; &nbsp; &nbsp;<span class="sy0">/</span>tmp<span class="sy0">/</span>django.userpath.db </div>
</li>
<li class="li1">
<div class="de1">&nbsp; &nbsp; &nbsp; &nbsp;&#8211;get-country-ip &#8211;get-os &#8211;after-<span class="re2">steps=</span><span class="nu0">3</span></div>
</li>
</ol>
</div>
<p>топ стран и топ осей пользователей которые сделали на сайте больше 3х шагов</p>
<p>&emsp;Тут мне даже сложно будет перечеслить все возможности которые есть у этой команды, а сколько всего Вы еще можете дописать!!! <img src='http://www.lyabah.com/wp-includes/images/smilies/icon_smile.gif' alt=':)' class='wp-smiley' /> </p>
<p>&emsp;<i>Следующие 2 возможности особо мне теплы, т.к. кроме того что они добавляют аналитику они еще и существенно облегчают жизнь программисту.</i></p>
<h3>BaseStreamCommand &#8211; отложеная статистика</h3>
<p>&emsp;Раньше, для сбора онлайн статистики о ваших пользователях &#8211; Вам надо было в момент захода этого пользователя раскидывать записи по таблицам и  возможно совершать какие-то дополнительные расчеты. Причем это надо было делать максимально быстро, чтоб пользователь не видел никаких задержек. С четко структурированными логами, такими как ucsvlog, нет необходимости делать это в момент захода пользователя. Достаточно просто дочитывать периодически логи, которые пишутся, и уже в момент чтений, уже раскидывать статистику. При этом ваши расчеты уже никого не задерживают. Я назвал это “отложенная статистика”, т.к. мы откладывает всю работу по ее расчет в отдельную команду.</p>
<p>&emsp;Вы пишите команду на вход которой подаются новые записи из каталога с логами. Причем подаются эти записи именно в хронологии возникновения их в логах. Т.е. если ваш сервис пишет 10 различных лог файлов одновременно и команда в момент запуска определила, что все они выросли с момента последнего запуска, то она будет выдавать к вам на вход записи с разных файлов в разброс в зависимости от того, где записи появляются раньше. Чтоб аналитика в этом случае была максимально четкой.</p>
<p>&emsp;Особенности работы такой команды является индексный файл ( sqlite3 ), в котором она держит данные которые используются между ее вызовами, например такие как &#8211; последние размеры лог файлов</p>
<p>&emsp;Помимо того плюса ускоренной работы пользователя является еще и то, что в случае, когда клиент захочет расширить онлайн статистику, например добавить в нее дополнительный ТОП &#8211; ему не надо будет ждать пока она накопится. Мы просто дописываем команду по сбору статистики, которая в момент первого запуска просто накопит недостающие данные и пойдет считать стату дальше.</p>
<p>&emsp;Наследника BaseStreamBlockCommand, передает анализу не одну строку,а  уже собранный блок.</p>
<h3>BaseConvertBlockCommand &#8211; конвертация логов.</h3>
<p>&emsp;Последней плюшкой анализатора, которая нами в данным момент обкатывается еще &#8211; это конвертатор.</p>
<p>&emsp;Меня всегда расстраивал тот факт, что логи надо удалять <img src='http://www.lyabah.com/wp-includes/images/smilies/icon_sad.gif' alt=':(' class='wp-smiley' />  А при использования django-ucsvlog апетиты засунуть в них чего по больше только растут, в результате они и стают очень толстыми.  Самое грустное, что единственным правилом для удаления логов всегда служил их срок, который прямо пропорционален размеру вашего винта и размеру плодящихся логов. Говоря короче большие логи живут меньше, т.к. надо удалять их быстрее, чтоб освобождать место другим логам.</p>
<p>&emsp;Но я не хочу удалять все логи, я хочу удалять из логов только ненужное. Мне через месяц будет неважен  call_info т.е. место, где были вызваны эти логи. Мне будет все также все равно  на заходы пользователя на всякие информационные страници, или к примеру стуки всяких мониторингов меня тоже будут не волновать. Но я хочу держать как можно дольше процесс совершения покупки и процессинга карты. Для этого и делается конвертатор, который перегоняет логи из толстых, в которых часть инфы актуальна только несколько дней, в тонкие, в которых остается инфа, актуальность которой максимально долгая. </p>
<p>&emsp;Ваша команда наследник от BaseConvertBlockCommand легко может с этим справляться. </p>
<p>&emsp;Вот пример команды, которая делает это у меня:</p>
<div class="geshi no python">
<ol>
<li class="li1">
<div class="de1"><span class="kw1">class</span> Command<span class="br0">&#40;</span>BaseConvertBlockCommand<span class="br0">&#41;</span>:</div>
</li>
<li class="li1">
<div class="de1">&nbsp; &nbsp; <span class="kw1">def</span> filter_convert_row<span class="br0">&#40;</span><span class="kw2">self</span>,row<span class="br0">&#41;</span>:</div>
</li>
<li class="li1">
<div class="de1">&nbsp; &nbsp; &nbsp; &nbsp; <span class="kw1">if</span> <span class="kw1">not</span> row.<span class="me1">is_a_req</span>:</div>
</li>
<li class="li1">
<div class="de1">&nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; <span class="kw1">return</span> <span class="kw2">True</span></div>
</li>
<li class="li1">
<div class="de1">&nbsp; &nbsp; &nbsp; &nbsp; <span class="kw1">return</span> <span class="kw1">not</span><span class="br0">&#40;</span>row.<span class="me1">data_path</span>.<span class="me1">startswith</span><span class="br0">&#40;</span><span class="st0">&#39;/info&#39;</span><span class="br0">&#41;</span> \</div>
</li>
<li class="li1">
<div class="de1">&nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; <span class="kw1">or</span> row.<span class="me1">data_path</span>.<span class="me1">startswith</span><span class="br0">&#40;</span><span class="st0">&#39;/test-exception&#39;</span><span class="br0">&#41;</span> \</div>
</li>
<li class="li1">
<div class="de1">&nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; <span class="kw1">or</span> row.<span class="me1">data_path</span>.<span class="me1">startswith</span><span class="br0">&#40;</span><span class="st0">&#39;/check-back&#39;</span><span class="br0">&#41;</span> \</div>
</li>
<li class="li1">
<div class="de1">&nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; <span class="kw1">or</span> row.<span class="me1">data_path</span>.<span class="me1">startswith</span><span class="br0">&#40;</span><span class="st0">&#39;/calculate-statistics&#39;</span><span class="br0">&#41;</span> \</div>
</li>
<li class="li1">
<div class="de1">&nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; <span class="kw1">or</span> row.<span class="me1">data_path</span>.<span class="me1">startswith</span><span class="br0">&#40;</span><span class="st0">&#39;/captcha&#39;</span><span class="br0">&#41;</span> \</div>
</li>
<li class="li1">
<div class="de1">&nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; <span class="kw1">or</span> row.<span class="me1">data_path</span>.<span class="me1">startswith</span><span class="br0">&#40;</span><span class="st0">&#39;/media&#39;</span><span class="br0">&#41;</span> \</div>
</li>
<li class="li1">
<div class="de1">&nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; <span class="kw1">or</span> row.<span class="me1">data_path</span>.<span class="me1">startswith</span><span class="br0">&#40;</span><span class="st0">&#39;/favicon&#39;</span><span class="br0">&#41;</span><span class="br0">&#41;</span></div>
</li>
</ol>
</div>
<p>&emsp;Тут указывается фильтр &#8211; какие строки надо оставить. Какие столбци надо оставить указывается в сетингсах. Детали смотрите в сетингсах, там под это выделен подраздел.</p>
<p>&emsp;Самое приятное в стриминге и конверторе &#8211; это то, что абсолютно не важно &#8211; сколько сервисов ведут свой лог. У Вас может быть ucsvlog на твистеде, отдельный на Django, еще отдельные логи ведут кроновские команды. А вот стриминг с конвертором берут и объединяют их в один поток, в один файл, где вы в хронологии сможете посмотреть события каждого из них. ( Да и не только питон, сам формат логов очень простой )</p>
<h3>Версионность логов.</h3>
<p>&emsp;Ваша структура логов будет меняться с тем, как меняется и растет Ваш проект. И разные версии логов не должны мешаться в файлах. Поэтому я в формат файла добавляю маркер версии. И для каждой версии создаю отдельный сетингс для анализатора.</p>
<p>&emsp;Например, когда я только подключил ucsvlog  к системе имена всех файлов логов оканчиваются на v1.ucsv. Потом я добавил дополнительные поля в строку открытия реквеста, и изменил формат файлов на v2.ucsv, но также создал файл analytics/v1.py  в которую положил настройки для первой версии логов. Теперь когда я буду парсить логи из первой версии я буду использовать этот сетингс. </p>
<div class="geshi no bash">
<ol>
<li class="li1">
<div class="de1">$ python manage.py djucsvlog_user_path_convertor \</div>
</li>
<li class="li1">
<div class="de1">&nbsp; &nbsp; &nbsp;<span class="sy0">/</span>var<span class="sy0">/</span>logs<span class="sy0">/</span>django<span class="sy0">/*</span>-v1.ucsv \</div>
</li>
<li class="li1">
<div class="de1">&nbsp; &nbsp; &nbsp;&#8211;<span class="re2">settings=</span>analytics.v1</div>
</li>
</ol>
</div>
<p>Тоже самое с каждой следующей версией</p>
<h3>Заключение</h3>
<p>&emsp;Как видите логи могут стать мощным средством для аналитики процессов системы и ее пользователей. Они могут даже стать часть коммуникации между вашими сервисами. С помощью них вы можете выделять самые главное и хранить это веками. И еще много чего они могут делать, чего я и сам еще не знаю <img src='http://www.lyabah.com/wp-includes/images/smilies/icon_smile.gif' alt=':)' class='wp-smiley' /> </p>
<p>&emsp;Вобщем подключайтесь, Вам понравится, я уверен <img src='http://www.lyabah.com/wp-includes/images/smilies/icon_smile.gif' alt=':)' class='wp-smiley' /> </p>
]]></content:encoded>
			<wfw:commentRss>http://www.lyabah.com/index.php/2012/04/04/ucsvlog-kyivpy-3/feed/</wfw:commentRss>
		<slash:comments>2</slash:comments>
		</item>
		<item>
		<title>UCSVLOG kyivpy#6 &#8211; Как облегчают жизнь качественные логи. Часть 2. Решение</title>
		<link>http://www.lyabah.com/index.php/2012/04/02/ucsvlog-kyivpy-2/</link>
		<comments>http://www.lyabah.com/index.php/2012/04/02/ucsvlog-kyivpy-2/#comments</comments>
		<pubDate>Mon, 02 Apr 2012 16:48:37 +0000</pubDate>
		<dc:creator>Oduvan</dc:creator>
				<category><![CDATA[UCSVLOG]]></category>
		<category><![CDATA[kyivpy]]></category>
		<category><![CDATA[logs]]></category>
		<category><![CDATA[Python]]></category>
		<category><![CDATA[ucsvlog]]></category>

		<guid isPermaLink="false">http://www.lyabah.com/?p=1062</guid>
		<description><![CDATA[Продолжаем о UCSVLOG. Начало читайте тут &#8211; Часть 1. Проблема и Идея
&#8195;Давайте, для начала, сформируем еще раз требования к логам.
&#8195; * Легко писать / читать. &#8211;  никто не хочет тратить ресурсы на такую пустяковую операцию, как логи. Они должны быть читабельны глазами без тулсов. И они должны быть простыми &#8211; чем проще механизм, тем [...]]]></description>
			<content:encoded><![CDATA[<p><em>Продолжаем о UCSVLOG. Начало читайте тут &#8211; <a href="/index.php/2012/04/02/ucsvlog-kyivpy-1/">Часть 1. Проблема и Идея</a></em></p>
<p>&emsp;Давайте, для начала, сформируем еще раз требования к логам.</p>
<p>&emsp;<strong> * Легко писать / читать.</strong> &#8211;  никто не хочет тратить ресурсы на такую пустяковую операцию, как логи. Они должны быть читабельны глазами без тулсов. И они должны быть простыми &#8211; чем проще механизм, тем он надежнее. Соответственно парсинг таких логов не должен быть сильно тяжелым.</p>
<p>&emsp;<strong> * Shit Happens</strong> &#8211; отказоустойчивость. Я не хочу сломать структуру логов в момент сбоя. Если в момент записи случится какой-нибудь сбой, то может не дописаться часть записи, и я хочу, чтоб структура такого лога осталась неизменной.</p>
<p>&emsp;<strong> * Индексы</strong> &#8211; о них и о их преимуществах мы уже успели рассказать  <a href="/index.php/2012/04/02/ucsvlog-kyivpy-1/">( Мне не надо про Свету каждый раз рассказывать, достаточно познакомиться один раз )</a></p>
<p><img src="http://www.lyabah.com/wp-content/uploads/2012/04/DSCN2550.jpg" alt="" title="DSCN2550" width="700" height="525" class="aligncenter size-full wp-image-1063" /></p>
<h3>python-ucsvlog</h3>
<p><img src="http://www.lyabah.com/wp-content/uploads/2012/04/DSCN2557.jpg" alt="" title="DSCN2557" width="700" height="525" class="aligncenter size-full wp-image-1066" /></p>
<h3>Формат</h3>
<p>&emsp;Общий формат логов выглядит так:</p>
<p><img src="http://www.lyabah.com/wp-content/uploads/2012/04/DSCN2559.jpg" alt="" title="DSCN2559" width="700" height="525" class="aligncenter size-full wp-image-1067" /></p>
<p>&emsp;Каждая запись должна начинаться с новой строки ( \n ) &#8230;</p>
<p><img src="http://www.lyabah.com/wp-content/uploads/2012/04/DSCN2560.jpg" alt="" title="DSCN2560" width="700" height="525" class="aligncenter size-full wp-image-1068" /></p>
<p>&#8230; а каждая ячейчка должна начинаться с  кавычки ( “ ). </p>
<p><a href="http://www.lyabah.com/wp-content/uploads/2012/04/DSCN2562.jpg"><img src="http://www.lyabah.com/wp-content/uploads/2012/04/DSCN2562.jpg" alt="" title="DSCN2562" width="700" height="525" class="aligncenter size-full wp-image-1069" /></a></p>
<p>&emsp;Ячейки должны быть разделены запятыми ( , ) &#8230; </p>
<p><img src="http://www.lyabah.com/wp-content/uploads/2012/04/DSCN2563.jpg" alt="" title="DSCN2563" width="700" height="525" class="aligncenter size-full wp-image-1070" /></p>
<p>&#8230; а кавычка внутри ячейки экранируется двумя кавычками ( “” )</p>
<p><img src="http://www.lyabah.com/wp-content/uploads/2012/04/DSCN2565.jpg" alt="" title="DSCN2565" width="700" height="525" class="aligncenter size-full wp-image-1071" /></p>
<p>&emsp;Вот такая простая для записи базовая структура. А отказа устойчивость такой структуры заключается в том, что маркера конца нет, т.е. конец ячейки или записи &#8211; это начало новой ячейки или записи. Т.е. в случае если случится сбой в момент записи, то мы потеряем только одну ячейку или одну запись, но не весь файл логов. Ну и конечно-же нет ограничения на количество ячеек в одной записи и их количество не обязательно должно быть равным, это дает существенную гибкость и кучу плюшек. </p>
<p>&emsp;Парсить такие логи очень просто, они парсятся потоково, можно начинать их парсинг с любой точки файла и без использования регекспов.  На <a href="http://www.checkio.org/">CheckIO</a>, кстати, <a href="http://www.checkio.org/mission/info/ucsvlog/">лежит задачка на эту тему</a>, попробуйте решить, может у Вас получится лучше чем у меня</p>
<h3>Формат данных</h3>
<p>&emsp; Теперь я расскажу &#8211; какие поля и в каком порядке кладутся запись лога</p>
<p>&emsp;<b>Index</b> &#8211; это индек, который дает нам древовидность и недублируемость данных. Он представляет собой запись времени и рандомный дополнительный параметр. Под индекс выделены первые 2 ячейки. Первая ячейка это твой индекс, вторая &#8211; индекс твоего родителя.</p>
<p><img src="http://www.lyabah.com/wp-content/uploads/2012/04/DSCN2574.jpg" alt="" title="DSCN2574" width="700" height="525" class="aligncenter size-full wp-image-1074" /></p>
<p>&emsp;<b>call_info</b> &#8211; Опциональна. Информация о месте вызова функции логирования, например имя файла, срока, имя функции, класс, модуль. Список этих данных кастомизируется в момент создания объекта логера. </p>
<p><img src="http://www.lyabah.com/wp-content/uploads/2012/04/DSCN2575.jpg" alt="" title="DSCN2575" width="700" height="525" class="aligncenter size-full wp-image-1075" /></p>
<p>&emsp;<b>log_info</b> &#8211; сюда мы кладем классический элемент важности логов dev, err, imp, log. Например при создании логера на продакшене мы можем указать, что не хотим записывать dev-логи.</p>
<p><img src="http://www.lyabah.com/wp-content/uploads/2012/04/DSCN2577.jpg" alt="" title="DSCN2577" width="700" height="525" class="aligncenter size-full wp-image-1076" /></p>
<p>&emsp;<b>log_data</b> &#8211; передается уже в момент вызова. Причем вызывать функцию записи логов можно не только со строковым аргументом но и с массивом, чтоб в одну запись уместить несколько значений. Это очень удобно для того, чтоб в последствии организовать поиск по ним, либо использовать эти данные для анализа.</p>
<p><img src="http://www.lyabah.com/wp-content/uploads/2012/04/DSCN2578.jpg" alt="" title="DSCN2578" width="700" height="525" class="aligncenter size-full wp-image-1077" /></p>
<p>&emsp;Как видите логи в этом формате очень гибкие, можно записать сколько угодно много данных, они будут структурированы, А читать их можно не только сначала но и с середины, при этом вы легко найдете начало первой валидной записи.</p>
<h3>CODE</h3>
<p>&emsp;Теперь давайте посмотрим, как это выглядит в коде.</p>
<div class="geshi no python">
<ol>
<li class="li1">
<div class="de1">glog.<span class="me1">a_log</span><span class="br0">&#40;</span>‘REQ’,’log_data1’<span class="br0">&#41;</span></div>
</li>
<li class="li1">
<div class="de1">glog<span class="br0">&#40;</span>‘Hi all’<span class="br0">&#41;</span></div>
</li>
<li class="li1">
<div class="de1">glog.<span class="me1">log</span><span class="br0">&#40;</span><span class="br0">&#91;</span>‘Payment’,’CardNumber’,<span class="st0">&#39;4111 *** **** ****’])</span></div>
</li>
<li class="li1">
<div class="de1"><span class="st0">glog.a_log(‘IN’,[‘UserID’,98])</span></div>
</li>
<li class="li1">
<div class="de1"><span class="st0">glog.imp([‘UserBalance’,1500])</span></div>
</li>
<li class="li1">
<div class="de1"><span class="st0">glog.c_log(‘REQ’)</span></div>
</li>
<li class="li1">
<div class="de1"><span class="st0"</span></div>
</li>
</ol>
</div>
<p>&emsp;1 <b>a_log</b> &#8211; мы открываем индекс. При открытии можно указывать имя, что-то типа метки, которую можно будет использовать как ссылку в коде. Вообще это не обязательно. Можно им пользоваться как структурированным линейным логом, без открытия индекса. Но я считаю древовидность &#8211; большим бонусом, которым надо пользоваться.</p>
<pre>
"I1,","a_log,"REQ,"log_data1
</pre>
<p>&emsp;2 <b>log</b> &#8211; записываем строковые данные. Т.е. запись одной ячейки. Т.к. у нас есть открытый индекс, то все остальные записи идут как его чаилды. А если мы логер используем как функцию, то он автоматом пишет логи с приоритетом log</p>
<pre>
"I1,","a_log,"REQ,"log_data1
"I2,"I1,"log,"Hi all
</pre>
<p>&emsp;3 <b>log</b> &#8211; запись еще 3х ячеек. Теперь мы явно указали, что приоритетность у нас log, и аргументом передали массив ячеек, которые надо записать</p>
<pre>
"I1,","a_log,"REQ,"log_data1
"I2,"I1,"log,"Hi all
"I3,"I1,"log,"Payment,"CardNumber,"4111 *** **** ****
</pre>
<p>&emsp; 4 <b>a_log</b> &#8211; открытие еще одного индекса. Все верно, уровень вложенности может быть бесконечный. И при открытии мы также можем указать не только строку, но и массив ячеек</p>
<pre>
"I1,","a_log,"REQ,"log_data1
"I2,"I1,"log,"Hi all
"I3,"I1,"log,"Payment,"CardNumber,"4111 *** **** ****
"I4,"I1,"a_log,"IN,"UserID,"98
</pre>
<p>&emps; 5 <b>imp</b> &#8211; запись еще 2х ячеек теперь уже в четвертый индекс, тот, который мы открыли последним. И приоритетность у него img</p>
<pre>
"I1,","a_log,"REQ,"log_data1
"I2,"I1,"log,"Hi all
"I3,"I1,"log,"Payment,"CardNumber,"4111 *** **** ****
"I4,"I1,"a_log,"IN,"UserID,"98
"I5,"I4,"imp,"UserBalance,"1500
</pre>
<p>&emps; 6 <b>c_log</b> &#8211; закрытия индекса. Тут закроются сразу 2 открытых индекса и REQ и IN, потому что мы при закрытии сказали метку открытия индекса. Индекс можно закрывать с записью в лог а можно и без. В закрытие лога как правило кладут результат выполнения этого блока. После закрытия всех индексов ведение записей будет идти без указания родителя, точно так-же как это происходило с первой строкой. А в записи закрытия родителем будет указана тот, кого закрывают, в нашем случае &#8211; первый</p>
<pre>
"I1,","a_log,"REQ,"log_data1
"I2,"I1,"log,"Hi all
"I3,"I1,"log,"Payment,"CardNumber,"4111 *** **** ****
"I4,"I1,"a_log,"IN,"UserID,"98
"I5,"I4,"imp,"UserBalance,"1500
"I6,"I1,"c_log,"REQ
</pre>
<p>&emsp; Рендерингом логов занимается сам логер, т.е. при создании логера ему на вход передается не имя файла, а темплейн для его формирования. Например на основе текущей даты. Это очень удобно для того, чтоб блоки не разбрасывались по файлам.</p>
<div class="geshi no python">
<ol>
<li class="li1">
<div class="de1">glog = Logger<span class="br0">&#40;</span>‘/var/log/<span class="sy0">%</span><span class="br0">&#40;</span>year<span class="br0">&#41;</span>s-<span class="sy0">%</span><span class="br0">&#40;</span>month<span class="br0">&#41;</span>s-<span class="sy0">%</span><span class="br0">&#40;</span>day<span class="br0">&#41;</span>s.<span class="me1">ucsv</span>’<span class="br0">&#41;</span></div>
</li>
</ol>
</div>
<p><img src="http://www.lyabah.com/wp-content/uploads/2012/04/DSCN2592.jpg" alt="" title="DSCN2592" width="700" height="525" class="aligncenter size-full wp-image-1083" /></p>
<p>&emsp;На этом все про ucsvlog как формат, дальше я просто пройдусь по плюшкам, которые мы используем постоянно при работе с ними. Единственное хочу отметить,последнюю идею по этим логам. Как вы помните вначале я рассказал про то, что и строки и записи только открываются, но не закрываются, но это накладывает определенную ответственность на ячейку которая идет вконце записи. Например обратите внимание на 5ую строку. </p>
<p><img src="http://www.lyabah.com/wp-content/uploads/2012/04/DSCN2593.jpg" alt="" title="DSCN2593" width="700" height="525" class="aligncenter size-full wp-image-1084" /></p>
<p>&emsp;Если случится проблема с записью на последней ячейке, которая не допишет пару последних нулей &#8211; то это будет большая проблема, т.к. тогда мы будем полностью уверены в том, что у пользователя баланс в 100 раз меньше, поэтому мы ввели дополнительный параметр close_row в котором можно передать значение последней ячейки в каждой записи. И теперь вы можете принимать запись как валидную только в том случае, если ее последним значением является закрывающий символ. Т.е. в нашем случае мы просто скажем что 5ая запись невалидна.</p>
<p><img src="http://www.lyabah.com/wp-content/uploads/2012/04/DSCN2594.jpg" alt="" title="DSCN2594" width="700" height="525" class="aligncenter size-full wp-image-1085" /></p>
<p><a href="https://bitbucket.org/oduvan/python-ucsvlog">Репозитарий python-ucsvlog на bitbucket</a></p>
<p><a href="http://pypi.python.org/pypi?:action=display&#038;name=python-ucsvlog&#038;version=0.1"> и на pypi.python.org</a> Т.е. себе можно поставить pip install python-ucsvlog</p>
<p>А теперь&#8230; плюшки&#8230; плюшки&#8230;.. плюшки&#8230;</p>
]]></content:encoded>
			<wfw:commentRss>http://www.lyabah.com/index.php/2012/04/02/ucsvlog-kyivpy-2/feed/</wfw:commentRss>
		<slash:comments>16</slash:comments>
		</item>
		<item>
		<title>UCSVLOG kyivpy#6 &#8211; Как облегчают жизнь качественные логи. Часть 1. Проблема и Идея</title>
		<link>http://www.lyabah.com/index.php/2012/04/02/ucsvlog-kyivpy-1/</link>
		<comments>http://www.lyabah.com/index.php/2012/04/02/ucsvlog-kyivpy-1/#comments</comments>
		<pubDate>Mon, 02 Apr 2012 12:21:13 +0000</pubDate>
		<dc:creator>Oduvan</dc:creator>
				<category><![CDATA[UCSVLOG]]></category>
		<category><![CDATA[kyivpy]]></category>
		<category><![CDATA[logs]]></category>
		<category><![CDATA[Python]]></category>
		<category><![CDATA[ucsvlog]]></category>

		<guid isPermaLink="false">http://www.lyabah.com/?p=1029</guid>
		<description><![CDATA[&#8195;Первое, о чем сразу хочется сказать &#8211; это то, что никогда не делайте презентаху в последний день, если Вы при этом предыдущую ночь сдавали проект. Можно потом утром в МакДаке возле Киевского вокзала сидеть и исправлять в фотошопе презинтаху

История
&#8195;В моей жизни уже было 2 проекта, в которых логи и их анализ занимали одну из ключевых [...]]]></description>
			<content:encoded><![CDATA[<p>&emsp;Первое, о чем сразу хочется сказать &#8211; это то, что никогда не делайте презентаху в последний день, если Вы при этом предыдущую ночь сдавали проект. Можно потом утром в МакДаке возле Киевского вокзала сидеть и исправлять в фотошопе презинтаху</p>
<p><img src="http://www.lyabah.com/wp-content/uploads/2012/04/DSCN25051.jpg" alt="" title="Alexander Lyabah, CheckIO Dev Team, UCSVLOG" width="700" height="525" class="aligncenter size-full wp-image-1032" /></p>
<h3>История</h3>
<p>&emsp;В моей жизни уже было 2 проекта, в которых логи и их анализ занимали одну из ключевых ролей.</p>
<p><a href="http://www.lyabah.com/wp-content/uploads/2012/04/DSCN2515.jpg"><img src="http://www.lyabah.com/wp-content/uploads/2012/04/DSCN2515.jpg" alt="" title="Alexander Lyabah" width="700" height="525" class="aligncenter size-full wp-image-1042" /></a></p>
<p>&emsp;Первый был во времена моей работы в банке, где я руководил проектом создания сети кеш терминалов самообслуживания. Терминалы ставили в очень отдаленных участках, где была плохая связь, где их могли разбить, обворовать или оборудование могло сбойнуть в любой момент. Все проблемы сваливались в одну точку и чем быстрее мы их решали, тем больше шанс избежать негативные последствия от возникшей проблемы. Тогда я вообще в первый раз задумался о несовершенстве простого логирования.</p>
<p>&emsp;Второй &#8211; в числе тех, который находится на поддержке у моей команды сейчас. Это аффилиейтская система с большим набором фронтовых сайтов, в которой аффилиатам, приводящих пользователей &#8211; платится бонус со всех их покупок совершенных с этих фронтов. И когда трафик не оправдывает ожидания по продажам &#8211; спрашивают у нас. Тут логи нам уже необходимы для анализа трафика.</p>
<h3>Проблемы линейных логов</h3>
<p>&emsp;Под линейными логами я понимаю классические логи, например syslog. Т.е. когда независимой информационной единицей является строка &#8211; есть сохраненный факт и время, которое и связывает его с другими такими-же фактами.</p>
<p><a href="http://www.lyabah.com/wp-content/uploads/2012/04/DSCN2520.jpg"><img src="http://www.lyabah.com/wp-content/uploads/2012/04/DSCN2520.jpg" alt="" title="DSCN2520" width="700" height="525" class="aligncenter size-full wp-image-1045" /></a></p>
<p>&emsp;Для примера хочу разобрать маленький детский пример о детях идущих в школу, по дороге есть несколько контрольных пунктов, которые запоминают факт прохождения ребенка. Предполагается, что эти логи будут использоваться не только для того, чтоб смотреть хронологию событий но и сводить потом какую-нибудь статистику по посещаемости.</p>
<p>&emsp;Формат ведения этих логов будет простой:</p>
<p><a href="http://www.lyabah.com/wp-content/uploads/2012/04/DSCN2524.jpg"><img src="http://www.lyabah.com/wp-content/uploads/2012/04/DSCN2524.jpg" alt="" title="DSCN2524" width="700" height="525" class="aligncenter size-full wp-image-1046" /></a></p>
<p>&emsp;После того, как Света выйдет из дома, станет на остановке и сядет в автобус, а Вова выйдет из дома &#8211; мы будем иметь следующую картину</p>
<p><a href="http://www.lyabah.com/wp-content/uploads/2012/04/DSCN25281.jpg"><img src="http://www.lyabah.com/wp-content/uploads/2012/04/DSCN25281.jpg" alt="" title="DSCN2528" width="700" height="525" class="aligncenter size-full wp-image-1049" /></a></p>
<p>&emsp;Первая проблема. Это избыточность. Мы со Светой познакомились еще в 7 утра, зачем нам рассказывать про нее каждый раз одно и тоже?</p>
<p><a href="http://www.lyabah.com/wp-content/uploads/2012/04/DSCN2530.jpg"><img src="http://www.lyabah.com/wp-content/uploads/2012/04/DSCN2530.jpg" alt="" title="DSCN2530" width="700" height="525" class="aligncenter size-full wp-image-1051" /></a></p>
<p>&emsp;Вторая вытекает из первой. Сложность ведения таких логов. Да, именно так, не смотря на кажущуюся простоту. Я говорю о том, что в момент записи логов у Вас в окружении должны быть все данные необходимые для формирования строки, а возвращаясь к нашему примеру &#8211; Света и Вова должны у себя на видном месте прицепить свидетельство о рождении, паспорт папы с разворотом прописки и дневник, чтоб на каждом пропускном пункте видели &#8211; кто прошел и что надо записать. (Можно ксерокопии, заверенную нотариусом. )</p>
<p><a href="http://www.lyabah.com/wp-content/uploads/2012/04/DSCN2532.jpg"><img src="http://www.lyabah.com/wp-content/uploads/2012/04/DSCN2532.jpg" alt="" title="DSCN2532" width="700" height="525" class="aligncenter size-full wp-image-1052" /></a></p>
<p>&emsp;Третья. И вобщем-то  основная &#8211; это сложность анализа. Потому что, когда мы будем сводить статистику, к примеру по возрасту детей &#8211; из-за мальчика, родившегося на улице с двумя словами в ее названии мы получим 77ти летнего мальчика и его отца со звонким именем 13.</p>
<p><a href="http://www.lyabah.com/wp-content/uploads/2012/04/DSCN2538.jpg"><img src="http://www.lyabah.com/wp-content/uploads/2012/04/DSCN2538.jpg" alt="" title="DSCN2538" width="700" height="525" class="aligncenter size-full wp-image-1053" /></a></p>
<h3>Идея</h3>
<p>&emsp;Почему со Светой и Вовой нельзя познакомиться один раз, а в остальных записях обращаться к ним по имени, например.</p>
<p>&emsp;Т.е. ввести какой-то индекс, по которому можно найти обратную инфу, а не дублировать ее, т.е. свете и Вове можено предаствить всю эту информацию на входе, а не таскать все это на себе.</p>
<p><a href="http://www.lyabah.com/wp-content/uploads/2012/04/DSCN2540.jpg"><img src="http://www.lyabah.com/wp-content/uploads/2012/04/DSCN2540.jpg" alt="" title="DSCN2540" width="700" height="525" class="aligncenter size-full wp-image-1055" /></a></p>
<p>&emsp;Из явных проблем можно выделить то, что логи сморят в момент возникновения проблемы, и именно проблема является отправной точкой Вашего анализа, дальше по логам как правило надо идти вверх. Т.е. если Света опоздает на автобус, то мы быстро найдет ее домашний адрес, но если она опоздает в школу, то поиск адреса может занять чуть больше времени, чем для простых линейных логов, где все инфа сразу хранится в одной линии. Поэтому группировать данные лучше на коротких дистанциях, для сохранения читабельности в момент возникновения проблемы. ( Хотя надо сказать, что и в линейных логах в момент возникновения ексепшена &#8211; надо брать и подниматься вверх по логам, чтобы собрать больше информации о возникшей проблеме )</p>
<p>&emsp;Ну и конечно-же то, что 77летний Вова никуда не делся, а значит проблема со структурой также еще актуальна. </p>
<p><a href="http://www.lyabah.com/wp-content/uploads/2012/04/DSCN2545.jpg"><img src="http://www.lyabah.com/wp-content/uploads/2012/04/DSCN2545.jpg" alt="" title="DSCN2545" width="700" height="525" class="aligncenter size-full wp-image-1057" /></a></p>
<p><a href="/index.php/2012/04/02/ucsvlog-kyivpy-2/">Во второй части статьи</a> расскажу, как python-ucsvlog решает эту проблему</p>
]]></content:encoded>
			<wfw:commentRss>http://www.lyabah.com/index.php/2012/04/02/ucsvlog-kyivpy-1/feed/</wfw:commentRss>
		<slash:comments>1</slash:comments>
		</item>
	</channel>
</rss>

