[Go][TIL] Animal Photo Classification Line Chatbot

Line Bot Animal photo classification

為了 Chatbot Day 準備的聊天機器人第二彈.

功能:

很簡單: 就是你上傳動物照片,他就會告訴你是什麼動物.

背後原理:

背後的機器學習模型就是鼎鼎大名的 Tensorflow Inception

註解: Tensorflow Inception 就是一個透過 CNN 建立出來的動物資料庫分類器

架構:

其實這個 Chatbot 還會連接我後端一個 API Server (tf-go-inception) .上面已經將 Inception 訓練好的 model 讀進來.

當你在 Line Chatbot 上面上傳圖片的時候, LineBotAnimal 就會將 圖片透過 multipart 的方式傳到 tf-go-inception 的 API Server

API Server 會將圖片透過 Tensorflow 來預測你的結果,並且傳回給 LineBotAnimal

參考:

[TIL] Paper: Consistent Hashing with Bounded Loads

原文: Consistent Hashing with Bounded Loads

在實作網路服務的過程中, Load Balancer 是最常被運用在分散流量到適當的伺服器之中. 而其中就是使用 Consistent Hashing 的演算法實現. 在使用 Consistent Hashing 的過程中,最被人在乎的就是兩個主要的問題

  1. 分布的均勻度 (uniformity)
  2. 當發生了新增與刪除伺服器的時候,需要有多少的移動次數.

Google 當然已經把這個問題解決,並且已經放在他們的 Google Cloud Pub/Sub 服務之中. 也在去年的八月將論文發表出來.

( Google 很擅長將神之技術寫成論文後,然後放在 GCP 裡面 XDD)

沒想到論文發表三個月後, Vimeo 的工程師將論文看懂後把相關演算法實現在 haproxy (這.. 應該不用解釋.. 就是最基本的開源 load balancer ) 之中,並且在 Vimeo 上線了. 並且將相關過程寫成這篇部落格….

有興趣的可以一起來鑽研這篇論文…. 不知道 Consistent Hashing 是什麼… 可以看看小弟當初練手用的 Golang Consistent Hashing

或是可以看看這堆 Viemo 工程師將它實現在 HAProxy 的 commit

[更新 2017/06/23]

後來這位工程師有機會跟 GDE 分享他的經驗,在這裡

這裡有另外一位,把相同概念完成到 Golang

程式設計週記[2017/03/31]: 又寫了一個聊天機器人.. XDD

這是什麼?

程式週記主要內容如下:

Gihub project 介紹:

  • 主要會貼一些github,但是會盡量寫上一些有用的評語(或是我容易想到的關鍵詞)幫助以後查詢

網路文章心得:

  • 會寫些心得,強迫自己閱讀.

“程式週記”並且定期週期性更新.

大部分內容在我的twitter都會有,這邊只是將一些簡單的心得與感想註解一下.

本週摘要

為了之後的 Chatbot Day ,最近用掉自己半夜的時間,把自我學習的聊天機器人完成了.

也很久沒有在寫一些小專案或是 side project ,感覺相當的好.



Go

mattn/mattn-icons

mattn 是一個 #Golang 很厲害的日本人,常為人熟知的作品就是 go-sqlite3 跟 gom .他有個招牌就是 github icon 是一個閒晃的小男孩(應該是吧) 這裡搜集一堆他的圖片

以下跟 Golang 有點關係,他在這個 repo 有放個 update-readme.go .當有新的圖片上傳,可以自動更新 README.md .算是很有趣的.

參考:



Python

Android/JAVA/NODE.JS



Docker

iOS/Swift



其他程式語言



論文收集



Kubernetes

Kubernetes Authentication plugins and kubeconfig

這個網站列出如何在 Kubernetes 上面的 authentication .

Five Days of Kubernetes 1.6

連續五天介紹 Kubernetes 1.6 的新功能,第一篇就是剛剛有人分享的 Dynamic Provisioning ,有興趣可以持續關注.

Kubernetes issue: kubeadm 1.6 is broken due to unconfigured CNI making kubelet NotReady

Kubeadm 可以讓你安裝 Kubernetes 就像是使用 docker swarm (v2) 一般容易.

所以除了 GKE, Kops 之外,這大概就是一般人很喜歡拿來架設 Kubernetes 的方法之一.但是它也是有一些限制就是 OS 的限制比較嚴格 (Ubuntu 16, centOS 7 …)

但是日前的 Kubernetes 更新到 1.6 的時候,不少人發現 Kubeadm 無法正常的使用了. 到了現在都還沒有被解決… 有興趣想了解的人可以一起看看…

想了解 kubeadm 的中文說明,可以參考我之前寫的部落格: http://www.evanlin.com/til-kubeadm/

Machine Learning

自駕車學習之路(ㄧ)

有人分享學習 Udacity 自動駕駛車的心得.

如果你還在考慮要不要學,可以看看他貼出的作業部份.很多作業都看起來很有趣…

參考: Udacity Self-Driving Car Engineer Nanodegree



網站文章

[關於影像處理的完整介紹]

裡面包含圖片,各種影像格式 av1, h264, h265 的編碼格式與一些基礎原理外.也有 ffmpeg 的相關操作. 對於想要惡補或是回顧的人會有趣.

裡面的解釋都很清楚,有大量的圖片作為輔助.相當的棒!



網站收集



有聲書/影片心得



小專案: 使用 LUIS 的自動學習聊天機器人

為了 Chatbot Day 準備的小專案(好像好久沒寫專案 XD)

LineBotBabyLuis: 就是當初寫好專案 luis go sdk 之後說要寫一個會自我學習的 chatbot 的 POC 小專案.

這個 Chatbot 具有自我學習的功能(其實不過就是每次問他,他不認識的,就會請你告訴他是哪個 intent )

透過微軟 LUIS 的功能,這個 chatbot 就算沒有任何資料庫也能夠做到自我學習.並且不斷累積知識的功能.

想學學 LUIS 怎麼使用的人(透過 Golang API ) 也可以看看.

之後會再寫個中文部落格來介紹這個….

[預告: Chatbot Day 還會有 Tensorflow 相關的 Chatbot,請期待…]

程式設計週記[2017/03/24]: 好好學習 Kubernetes 跟 Tensorflow

這是什麼?

程式週記主要內容如下:

Gihub project 介紹:

  • 主要會貼一些github,但是會盡量寫上一些有用的評語(或是我容易想到的關鍵詞)幫助以後查詢

網路文章心得:

  • 會寫些心得,強迫自己閱讀.

“程式週記”並且定期週期性更新.

大部分內容在我的twitter都會有,這邊只是將一些簡單的心得與感想註解一下.

本週摘要

深刻體驗到時間不夠用的痛苦,又需要準備四月份的一些演講,又需要弄公司的東西,不過相當得充實又有趣啊.

四月一共有一場分享加上一場大型研討會.雖然兩個都會提到 Tensorflow ,但是內容有些不太一樣.



Go

Slide: 簡單介紹 golang 使用的 gc 演算法

介紹 GC 演算法在 stack 的 scan 方式,在 Go 1.7 的時候 stack rescaning 會造成 GC Pause (俗稱的 Stop-The-World).

在 Go 1.9 的 Proposal Eliminate STW stack re-scanning 就是為了要減少這樣的問題. 在 1.8 已經預設打開.

參考: DK 的文章

Automatic Stackdriver Tracing for gRPC

這篇講解了如何透過 Golang 來撰寫一個使用 stackdriver (也就是 Google 之前所併購的線上分散式追蹤 distributed tracing 的工具) 來查看在 gRPC 下問是否有任何問題.

想要試試看 Open Source 的 distributed tracing ? 那麼可以試試看最近進入 CNCF 的 Open Tracing . 官方的部落格有一個範例讓你學習如何用 Golang 透過 Open Tracing 來追蹤 http latency

名詞解釋: CNCF (Cloud Native Computing Foundation) 是由 Google, Intel, CoreOS 與華為 等等各家網路 大公司所組成的協會.主要選取一些優秀的服務來推廣適合作為 Cloud Native Computing 之用.. 目前裡面的軟體有: Kubernetes, Prometheus, Fluentd 與 GPRC .. 等等 Cloud Native 上重要的服務

3.5 Years, 500k Lines of Go (Part 1)

juju 是ubuntu 開源出來使用 Golang 開發的 devops 工具,目前已經開發了超過三年多的過程.他們分享在公司內部如何使用 Golang 的.

不論是如何做 package management (使用 godep) 或是專案的如何組織與分割各種不同的 repo .分享了許多使用 Golang 作為大型專案開發的經驗,很推薦大家一起來學習.



Python

Qix-/better-exceptions: Pretty and useful exceptions in Python, automatically.

可以讓 python 的 exception 顯示得更漂亮.

Android/JAVA/NODE.JS

derhuerst/tcp-over-websockets: Tunnel TCP through WebSockets

透過 websocket 來做 TCP tunnel .



Docker

iOS/Swift



其他程式語言



論文收集



Kubernetes

Lessons Learned: Using Concourse In Production

這篇介紹了 ChatWork 這間公司從 AWS EC2 + Jenkins 移到 Kubernetes Helm + concourse CI 所學習到的一些課程.

有好的部分,也有一些犧牲,挺值得看看的.

https://kubernetes.io/docs/concepts/cluster-administration/access-cluster/ 搞懂 API server ….

  1. token, namespace 只能在 pod 裡面使用…
  2. API server 也建議從 pod 裡面呼叫…
  3. pod 裡面都會有 /var/run/secret ….. 的資料… 裡面就是從 pod 裡面設定的權限…

參考

Monitoring Kubernetes

由 sysdig 寫的技術部落格,主要是講解如何在 Kubernetes 上面做監控( Monitoring ).內容整理得相當好.

一連有五篇,一開始從 Kubernetes 的基本開始介紹.並且介紹大家常用的 cAdvisor, Kubernetes Dashboard, Kube-state-metrics 跟 Probes.並且也有介紹經常遇到的問題與解決方式.

當然.. 最後會廣告一下他們自己的產品 XDD



Machine Learning

GitHub - readbeyond/aeneas: aeneas is a Python/C library and a set of tools to automagically synchronize audio and text (aka forced alignment)

有人寫出透過 python 與 c 來做自動對聲音跟文字的工具.

GDG-Shanghai 2017 TensorFlow Summit Recap

GDG SH RECAP slide 相當有幫助喔

Neural Networks and Deep Learning: Free online ebook

不錯的電子書關於類神經網路與深度學習.

Index of Best AI/Machine Learning Resources

整理一些不錯的 Machine Learning 的資源.

Practical Deep Learning For Coders, Part 1,

快速學會寫深度學習的程式,免費 18 小時線上課程

Models built with TensorFlow

這邊列出不少透過 Tensorflow 建立出來的有趣 ML Models ,不論是 image to text 或是 NLU 專案都有.

[slide: Stream Programming

with Kafka Streams](https://docs.google.com/presentation/d/1YOFdWrNtXQccKuup8OO-DIARN4V5eft3N9-TwZb4rBw/edit#slide=id.p)

強者我同事在 Flink Meetup 上面討論關於 Kafka Streams

Data Coding 101 – Intro To Bash

許多.. bash 相關技巧,對於做 data coding 的人有很多幫助.



網站文章

Learn how to design large-scale systems. Prep for the system design interview.

[學習如何設計一個具有規模的系統]

這一篇整理了很多大型系統會用到的一些範例,原本作者是準備要作為面試之用,裡面整理了許多關於大型或是分散式系統的設計原理,原則甚至是一些模式.

雖然我們都已經經常在使用,但是這一篇文章相當適合當作大型系統設計的教材.

I’ve been a Web Developer for 17 Years, and this is what I learned - Daniel Khan

很有趣的故事…. 也可以看到這十多年 web developer 的改變

OpenTracing: Towards Turnkey Distributed Tracing

舊聞… 不過看完就知道 opentracing 為何可以進 cncf 了.. dapper 論文發了之後… distributed tracing 就是顯學…

雖然是官方的廣告 blog 不過整個介紹的夠清楚…

網站收集



有聲書/影片心得

[TIL] 分散式系統上的追蹤

Automatic Stackdriver Tracing for gRPC 這篇講解了如何透過 Golang 來撰寫一個使用 stackdriver (也就是 Google 之前所併購的線上分散式追蹤 distributed tracing 的工具) 來查看在 gRPC 下問是否有任何問題.

講到 stackdriver,主要就是為了要解決在大型分散式系統中如何追蹤多個系統間相互溝通的問題. 有幾個很棒的系統,像是 2010 年 Google 發表了論文 ( Dapper, a Large-Scale Distributed Systems Tracing Infrastructure)),還有 Twitter’s Zipkin 也都是佼佼者.

但是最近進入 CNCFOpen Tracing 就相當的優秀,不僅僅是開源的系統,更提供各種語言的連接工具.

Open Tracing 官方的部落格有一個範例讓你學習如何用 Golang 透過 Open Tracing 來追蹤 http latency

名詞解釋:

CNCF (Cloud Native Computing Foundation) 是由 Google, Intel, CoreOS 與華為 等等各家網路 大公司所組成的協會.主要選取一些優秀的服務來推廣適合作為 Cloud Native Computing 之用.. 目前裡面的軟體有: Kubernetes, Prometheus, Fluentd 與 GPRC .. 等等 Cloud Native 上重要的服務

參考:

程式設計週記[2017/03/17]: 想要學習一件技術最好的方式,就是先去報名分享的研討會(誤)

這是什麼?

程式週記主要內容如下:

Gihub project 介紹:

  • 主要會貼一些github,但是會盡量寫上一些有用的評語(或是我容易想到的關鍵詞)幫助以後查詢

網路文章心得:

  • 會寫些心得,強迫自己閱讀.

“程式週記”並且定期週期性更新.

大部分內容在我的twitter都會有,這邊只是將一些簡單的心得與感想註解一下.

本週摘要

最近聽到同事 J 的名言 : “先去報名分享,就會學習到這門新的技術”

挺好的.. 所以我也去報名了一些研討會,於是又欠一堆 slide 要準備.最近加緊在學習 Tensorflow 中.

最後,很久沒有寫小專案了.於是手會癢(剁手) 就跑去刷 HackerRank 的題目(因為裡面有 Go ).很好玩,裡面 easy 的真的太 easy .. 不小心刷到 Hard 的還會要求時間複雜度,真有趣啊.



Go

Fission: Serverless Functions for Kubernetes

fission 是一個透過 Golang 完成的 kubernetes serverless function 的伺服器.

目前 serverless 支援的語言有:

  • dotnet
  • python
  • nodejs
  • php7

Giving dep a try: Using the new Go dependency tool with piladb

Dep 已經越來越重要了,甚至被考慮當成官方套件之一。這篇文章透過使用 dep 來開發 piladb 一個堆疊式資料庫。整個流程可以學習使用 dep. 來看看吧。

Go doesn’t support exception, in syntax. Go has many exceptions, in syntax.

覺得 Go 有很多語法限制嗎? 其實他也是有很多語法例外,來看看這篇的介紹,很多沒想過的語法例外。

這篇文章看了好幾天,終於看完. 透過 #Golang 來介紹 Linux 中與 Kernel 溝通的另外一種方式 “Netlink”

本文的作者原來是在看 Prometheus 的一個工具 node_exporter 的時候發現一個跟 WiFi 的有關的 issue ,看了幾個禮拜後發現是 ioctl 太慢了… 於是就決定要換成 Netlink

[科普] Netlink Socket 是一種在透過 kernel 來傳遞訊息的方式,但是跟一般常用的 ioctl 不同的是 Netlink 透過 udp 來傳遞,不需要像 ioctl 一樣需要有透過 response ,所以他的速度比較快.

Netlink Socket 優點:

  1. 透過 UDP 沒有 ioctl 的 kernel round trip time
  2. 可以一次發給同一個 group 中的 user process

缺點:

  1. UDP 老問題.. 你不確定對方有沒有收到
  2. 由於透過 socket 其實感覺不如 ioctl 那麼的直覺

這篇文章也附上透過 Go 來實作 Netlink 的 github 可以看看

BTW: Prometheus 的 node_exporter 感覺很好用??

Netlink Go package:

關於 Netlink Socket 可以參考

knq/usql: usql is a universal command-line interface for SQL databases

一個很方便的工具,只要輸入 db connect string 就可以透過 cli 操作資料庫

aschagrunert/ccli: Command line parsing in go, with coloring support 🌈

一個撰寫 cli 的套件,類似於 spf13/cobra 只是可以讓他更多顏色



Python

Android/JAVA/NODE.JS

A blockchain in 200 lines of code

使用兩百行代碼來開發簡單的區塊鏈.



Docker

iOS/Swift



其他程式語言



論文收集

Challenges to Adopting Stronger Consistency at Scale

找時間要看…



Kubernetes

Introduce Kubernetes Course

基礎的 Kubernetes 教學… 有興趣的可以上去學學

Getting Started With A Local Kubernetes Environment

想學 Kubernetes 卻不想要開 AWS 或是 GCP?

那就看看這篇網頁吧,裡面把所有本地端可以學習 Kubernetes 的方式都詳列出來.不論是 cluster 或是 single mode

BTW: Corel APP for Mac OSX 跟 Kubernetes Cluster for Mac OSX 很方便啊..

johanhaleby/kubetail: Bash script to tail Kubernetes logs from multiple pods at the same time

一次可以拿 K8S 上多個 POD 的 logs



Machine Learning

A massive dataset of manually annotated audio events

Google 開源他們一些研究的音效資料集.

在TensorFlow 1.0上實現快速圖像生成算法Fast PixelCNN++

伊利諾大學香檳分校的研究者在 GitHub 上發布了一個快速圖像生成算法 Fast PixelCNN++的實現.論文在這裡

[Asgard is deprecated at Netflix. We use Spinnaker ( www.spinnaker.io ).] Web interface for application deployments and cloud management in Amazon Web Services

Netflix 舊版的雲端管理系統,雖然已經被廢棄掉.但是裡面的 wiki 有一些不錯的文章,比如說:

Baidu Deep Voice explained: Part 1 — the Inference Pipeline

百度公佈他們的最新系統 Deep Voice 號稱比 Google 的 WaveNet 還要快速可以產生 TTS (Text To Speech) 並且具有情緒與其他各種可以調整的部分. 這一篇就是來講解 Deep Voice 的方法,第一部分就要探討他的 Inference Pipeline . 關於 Deep Vioce 這裡有中文介紹[engaget]

如何面試資料科學家? (How to Interview Data Scientist?)

這些建議很忠肯… 我當初幫忙面試團隊中的夥伴們也都有依照這個方式.

Moocs: Big Data Analysis with Scala and Spark

雖然也是 Scala 這次的課主要專注在 spark 跟 distributed data parallelism

jostmey/NakedTensor: Bare bone examples of machine learning in TensorFlow

一些簡單的 tensorflow 範例

google/seq2seq: A general-purpose encoder-decoder framework for Tensorflow

Google 開源的 encoder-decoder 工具,本來是使用文字翻譯支用,但是 Google 強調這應該是 tensorflow 上通用的一個工具.



網站文章

vscode-tips-and-tricks: Collection of helpful tips and tricks for VS Code.

搜集 vscode 一堆訣竅與 tips ,由微軟編輯的

JWT (JSON Web Tokens) is a Bad Standard That Everyone Should Avoid

裡面提到 JWT 是不好的標準,還會讓你系統變得脆弱外.

drduh/macOS-Security-and-Privacy-Guide: A practical guide to securing macOS.

Mac OSX SEP: MacOS 的安全和隐私指南



網站收集



有聲書/影片心得