[研討會心得]PyCon APAC 2014 05/17 Lighting Talk

  • MOOC or MOOCs
    • Moocs.org
  • eDX
    • Open edX
    • Receive high education
  • Show-and-Tell code
    • A ideal to show your code to other
    • Pros
      • You need make your code readability
      • Bring your idea to other one.


  • Pelican  static clean Blog system
    • Support RSS markdown
    • Install
      • pip install pelican
    • Very extended

  • 用NetworkX 找 台灣公司網絡中心


  • ciphers 密碼學

    • pip install classical_ciphers

    • 三種加密

    • mono

    • poly

    • trans

CAPTCHA is hard for mobile touch device

Using drag image to other. 

[研討會心得][PyCon APAC 2014] 05/17 Day 1 note

Python-powered Analysts @WesMackinn

  • Author for “Python for Data Analysis”
  • Python’s role in 2014 for analysis
  • BI
    • Query 
    • Report ordinary
    • Alert when trend change
  • ETL (Extract Transform Load)
    • moving data between storage format
    • Normalization
  • How did we get here?

    • Good develop tool —  iPython

    • Learning resource:

    • nbviewer.ipython.org

      • static html share space
    • The libraries packaging tech become more maturing.
  • Why did pandas succeed?

    • tasteful and consistent solutions

    • passionate user base

    • An API optimized for 

    • terminal-freindliness

    • composability 
  •  Tools before Data Analysis

    • Cython

    • NumPy

    • matplotlib

    • ipython

  • Python might not best language for Data Analysis, but everyone can using python to discussion.

  • Scikit-learn http://scikit-learn.org/stable/

    • Machine learning in python.
  • Pandas: The good and bad

    • Ecosystem compatibility

    • Design for broad appeal

    • The big data problem.

  • Big Data Trend

    • Python/R/Julia growing 

    • JVM-base big data ecosystem

    • Concurrent / multicore programming challenges

  • Staying competitive

    • “Enterprise money” is still stay in JVM-Ecpsystem
  • A bit about DataPad http://www.datapad.io/

    • Exploratory analytics and report-building environment

    • Powerful analysis tool

    • No coding

    • Collaboration and sharing tools for teams

  • Note - FAQ:

    • What DB is DataPad.io

    • DB is propitiatory 

d3 with Python

https://pyconapac2014.hackpad.com/Real-time-visualization-with-Python-and-d3.js-73-LGLyhjzr5qY

 


Python to LiveScript

A speech for how to jump LiveScript to Python

  • LiveScript

    • Concise Syntax

    • say bye to bad parts of javascript

    • many improvement for OOP

    • many features of FP

  • Language Change:

    • JS+Ruby = CoffeeScript

    • CoffeeScrip

  • Some note:

    • $ is “this”

    • Bond range for indent

    •  string until space  =>    abc = “abc”

    • comment

  • Check how to use module (or check API)

    • Python

    • dir(path)

    • LiveScript

    • Object.keys path
  • Object access

    • Python [0]

    • LS: .0 


LiveMedia and ffmpeg

https://pyconapac2014.hackpad.com/VapourSynth-comes-does-it-indicate-that-AviSynth-will-shutdown-29-Dr34xdWrkzz

 


Docker shipping Python project by Docker


Python and Science http://fperez.org/

  • The ideal and reality of science

    • Using code to validate 

    • More cited in CV

  • Open Source Software in this context

    • Open, collaborative by definition

    • Response

  • The second best program language in the world

    • Maybe it is not the best solution but everyone can use it to communicate.
  • SciPy, NumPy are tool for scientist 

  • Python for scientists

    • separation of concerns

    • huge collaborate

  • Software-carpentry.org http://software-carpentry.org/

  • Data Science in Python CS 109 in harvad 

  • iPython

    • Has graphic UI

    • kernel can parse any content (HTML/PDF)

    • Can join Julia code and Python code.

    • Deep language integration

    • iPython can integrate in http part as a listener to hook web site to run python code and return result instantly.

    • One line code to get integrate UI for python result.

    • Can establish blog system

  • iPython on OSS

    • Enthoughy

    • Wakari.io

    • MSFT VS2013 has iPython integrated

    • StarCluster

    • IBM Watson (machine learning)

    • Authorea

    • Plotly (iPython with d3)

    • NBDiff.org http://nbdiff.org/

    • Google Research and iPython experiment

    • Collaborator Notebook (like http://nbviewer.ipython.org/ collaborate version)

小海嚴選

  • 為何想做小海嚴選

    • 個人興趣

    • 工作需求(老婆是經紀人)

  • FB “Like” is hard to collect and summarized (only in activity log)

  • 資訊爆炸的年代 (策展時代)

    • 資訊爆炸有人要你過濾資訊
  • FQL

    • select object_id from like where user_id is “me”
  • How to development

    • Using iPad for prototyping 

    • Prompt

    • Django framework

    • 會員系統  pip install django-userena

    • API djangorestframework

    • django-oauth2-provider
  • 動態縮圖

    • thumbor + CDN
  • 免費營運

    • 0元營運~

    • Heroku dyno 1

  • API 應用

  • Hubot plugin https://hubot.github.com/

Python in VIM

  • Python interface to VIM

    • :help python

    • :python :py   REPL python

    • :pydo return str(sum(map(int, line.split())))

    • 累加每一行

    • line 是每一行的代表

    • :pyf :pyfile

    • run current python code with python.
  • vim module

    • :py import vim

    • import vim as module using for

    • vim windows

    • vim.tabpages

    • vim.current

    • vim.current

    • vim buffer

    • vim.command(str)

    • using vim to operate this file or other file

    • vim.eval

    • the same with python.eval

    • vim.vars

    • Windows Object
  • example - Conque

  • example - python-mode

    • It could run python directly (lead key+R) lead key is assign by self

    • file syntax check


OpenStack 簡介

  • What is OpenStack

    • OpenStack build your own cloud

    • Restful api

  • Trystack

    • http://trystack.org/

    • Need FB account

  • devStack

  • Component

    • keystone - auth and service catalog 

    • nova - VM

    • glance - image service

    • cinder - block storage service

    • swift - object storage service

    • neutron -  network

  • Project

    • trove - database as service

    • sahar - provision a Hadoop cluster on top of OpenStack

    • taskflow - look like sql transaction

    • oslo messaging -

  • Component communication

    • REST api

    • AMQP

[OpenData]在駭客松前試做一個把csv與xml轉成json的converter (csv/xml parser) 主要在解決big5/utf8 編碼問題

最近為了要參加OpenData的Shareable Cities駭客松,也為了好好練習一下Python.決定從頭到尾都要使用python當做我主要的程式語言.
比賽中一開始以為資料都來自于政府的OpenData網站 data.gov.tw,所以去觀察了一下這個網站裡面的資料,發現有以下的一些問題:

  • 資料格式不統一:

    • 可以看到政府單位的Open Data  有 XML,CSV與JSON 三種資料格式
  • 資料內容格式不統一:

    • 先提到所謂的內容的格式,也就是編碼(encoding)不統一.有的檔案用big5 有的用utf8,這在 python(2.7)與 Ruby (2.1) 是很大的問題,也是這次主要解決的問題.
  • 資料內容不統一: 

    • 有些資料第一列是敘述欄位,有的時候卻是直接開始資料.

所以,我在比賽前想先做出一些工具,可以在比賽當場使用:

  • 統一輸出JSON資料,並且統一編碼為utf8

  • 可以轉換CSV與 XM: 到JSON

  • 可以解決 big5/utf8的編碼問題

  • 可以是情況的把前面幾列忽略掉,輸出更漂亮的資料格式

於是在比賽的前一個禮拜,開始做這個工具.主要會用到以下的python libraries:

  • PyQuery: 主要是拿來做為xml 的parser,相當好用.

  • request  : 主要拿來作為網路資料的下載,一般人常用的url lib 是不錯用,只是有時候遇到長網址會出現問題.

  • csv, json, os 這些必用的  python libraries 就不詳細敘述

這裡記錄一些在做工具的時候發生的事情:

  • Encoding error的問題

    • 原因:

      • 有的檔案用big5 有的卻用utf8,這裡影響兩個地方,一個是csv的資料讀入.一個是json資料dump
    • 解法:

      • 會試著去使用各種預先列出的encoding 方式,然後傳回正確的結果

 

 

* 參考:



  * [http://stackoverflow.com/questions/15918314/python-detect-string-byte-encoding](http://stackoverflow.com/questions/15918314/python-detect-string-byte-encoding)

 最後列一下這邊的githubHeroku (還有xml的) 資料

 

最後記錄一下駭客松(Hackthon)初體驗的心得:

  • 最後其實不用交出實作,只要prototype 看起來有work 就好 (點下去會跑貼圖的app?)

  • 各種事先準備工具真的很重要,程式主體應該只是在當場組合就好

  • 如果要用backend 應該要有frontend  的部分一起準備

  • 其實偷做才是王道,當場只要討論slide表現重點比較好. 

參考資料:

[研討會心得]2014/03/22-微軟技術關卡破解日

會議的時間是2014/03/22

全部影片的網址在這裡: http://channel9.msdn.com/Events/MVP-Virtual-Conference/MVP-Comcamp-Taiwan-2014
這個研討會我沒有辦法參加,雖然在週末但是有事情無法參加.不過盡量用自己的時間來找一些有趣的topic來看.

  • Visual Studio + C# 開發 Android APP

    • VS2013可以利用Xamarin 來利用C#開發Android,對於C#可以說是又愛又恨.愛的是它簡單易入手,恨的是他的delegate,event跟Lambda相當的難懂.沒錯,易入手但是要深究相當的累.

    • 這篇是中文介紹,利用C#做了幾個範例: Hello world,Toast 範例,JSON string parsing跟Web service的範例.

    • 整體開發界面跟ADT沒有太大差異(檔案架構)

      • layout -> 可以跟 Android共用 檔名不同 xml-> axml

      • drawable -> 跟Android用法一樣

    • 使用的語言,當然就是C#甚至可以使用微軟的.net相關的 System 函式庫

    • 感想:

      • 可以使用 .Net函式庫算是很方便,而且就IDE的上手度而言Visual Studio應該會讓很多人上手度比起ADT 的Eclpse 或是 Android Studio快多了.

      • 有許多可以下載即用的函式庫 Newtonsoft.JSON 就是其中之一,代表許多你在desktop 的跟資料處理有關的函式庫可能都可以直接搬過來.

    • 總結: 

      • 想要開發工具可以考慮,若是長期而言還需要好好的考量.畢竟許多可以參考的open source library都沒有能幫助你在C# for Android 的部分.
  • 如果,不愛了呢-談程式設計師的生涯規劃

    • 這篇想探討的是跟程式設計以外的事情,也就是面對著新技術接踵而來,該如何學習?該如何繼續從事這行?

    • 所謂的薪資是公司把員工留下來的最低成本,而所謂的成本就是:

      • 公司是否賺錢

      • 你能幫公司賺多少錢

      • 你在企業內外的影響力

      • 你的市場行情

        • 特別重要的是~企業內外的影響力
    • 所謂得工程師

      • 除了深度還要有廣度

      • 接近老闆,主動回報

    • 名言摘錄:

      • 你的時間花在哪裡~成就就在哪裡

      • 大部人努力的程度都不夠到拼天賦

    • 感想:

      • 要不斷的努力,懂得分配時間到正確的時間

[python][mac][OpenCV]在Mac上面利用Python來操作OpenbCV (Using OpenCV in Mac via python)

最近不斷地為了PyCon APAC 2014在惡補Python,在臉書的討論區裡面看到這邊討論OpenCV for Python的文章

有介紹到有人為了OpenCV for Python 寫了專門的講解 blog

好奇之下開始去尋找如何去使用python在Windows上面,想不到真是有點麻煩.

於是又把念頭動到Mac上面,想不到比想像中的簡單多了,參考這篇(update-installing-opencv-on-mac-mountain-lion/)

  • brew tap homebrew/science

  • brew install opencv

  • mkdir -p ~/Library/Python/2.7/lib/python/site-packages

  • echo ‘/usr/local/lib/python2.7/site-packages’ > ~/Library/Python/2.7/lib/python/site-packages/homebrew.pth

找了一篇測試的程式碼搭配著JPEG果然是成功的,於是開始去把自己之前OpenCV Camera Testing Sample拿來改成python版本.

要改其實不難,主要是要去一個一個把API從C++換成Python.可以去官方API列表來找,幾乎都有兩個語言的版本.

要找詳細的code可以去看Github https://github.com/kkdai/python_learning/blob/master/OpenCV_OpenCamera.py 

目前開起相機是成功的,不過要抓取keycode有點問題還需要解決,解決完後就可以弄旋轉的部分.

 

雜話: 我真的不了解,身為一個軟體工程師有什麼理由不買Mac 的.就算你是Windows 的開發工程師,Mac可以直接裝Windows.更何況如果你是非Windows工程師,使用Homebrew任何程式語言都可以馬上裝好.最近安裝不論是Scala或是這次安裝OpenCV或是之前安裝Django就是那麼簡單.

[python][django] 自己開始寫符合RESTful的server與client(2)

其實比起架設RESTful的django伺服器,撰寫一個client去對它存取似乎是簡單多了.
要用到的東西也很少,因為Python本身對於JSON的處理就相當的簡單.
所有的處理都是使用到原先架設好的伺服器裡面的資料 http://sleepy-plateau-3929.herokuapp.com/snippets/.json

這裡稍微提一下GET需要注意的事情

  • 可以使用urllib2的urlopen來讀取網頁

  • JSON有個直接可以使用的json.load

  • 處理過來如果一開始是object可以使用 result[“object”] 來找,反之可以用 list 去處理 List Data

  • context 的部分,可以處理多個以上的context

    • context = {“context_1” :value1, “context_2” : value2}

接下來直接看code

 

POST需要注意的事情

  • 要存取網頁上面的表單資料(form)其實很簡單

    • request.POST[“value_name”]
  • 表單(form)的樣板(template)記得要有csrf_token

  • 先確認你的伺服器支援post 的RESTful Add,如果要上傳JSON你的Content-Type要對

  • Python requests 是個好用的library,一定要用

接下來看code

 

 

最後完整的github在這裏