[TIL] Cassandra Backup Survey

Preface

Our cassandra instance sometime got crash mess amount of data. To backup those data to another storage is task need to do.

CQLSH

First backup canssandra schema

Export entire schema of your cassandra.

cqlsh -e "DESC SCHEMA" > user_schema.cql

Or you can specific your keyspace here.

cqlsh -e "DESC SCHEMA" > user_schema.cql

Export and Import cassandra data

Export

COPY <tablename> [ ( column [, ...] ) ]
     FROM ( '<filename>' | STDIN )
     [ WITH <option>='value' [AND ...] ];

For example

cqlsh> COPY log.parts FROM STDIN;

Another example to transform output format

cqlsh> COPY log.chatlogs (ts, content, other) TO './chatlog.dat'
   ... WITH DELIMITER = '|' AND QUOTE = '''' AND ESCAPE = '''' AND NULL = '<null>';

Import

cqlsh> COPY emp (empid,deptid,last_name,first_name) FROM 'temp.csv';

Troubleshooting

  1. Cannot dump all DB because partition.
Error for (-5813055698912042437, -5769658640073958582): Failed to connect to all replicas ['10.123.456.789'] for (-5813055698912042437, -5769658640073958582), errors: ['NoHostAvailable - (\'Unable to connect to any servers\', {\'10.123.456.789\': error(None, "Tried connecting to [(\'10.123.456.789\', 9042)]. Last error: timed out")})'] (will try again later attempt 1 of 5)

Ans:

Because your cassandra has three partition, and it is in GCE. We only export one port for cqlsh remote connect. So, you could not get any data from your other two partition.

Try install cqlsh in GCE machine with pip install cqlsh.

  1. pip install cqlsh has some problem with copy.
'module' object has no attribute 'parse_options'

**Ans: **

We could not use cqlsh from pip, suggestion use cassanra’s cqlsh. Refer jira

sudo docker run -it cassandra /usr/bin/cqlsh

Refer:

程式設計週記[2017/01/06]: 新年新希望: 健康與毅力

這是什麼?

程式週記主要內容如下:

Gihub project 介紹:

  • 主要會貼一些github,但是會盡量寫上一些有用的評語(或是我容易想到的關鍵詞)幫助以後查詢

網路文章心得:

  • 會寫些心得,強迫自己閱讀.

“程式週記”並且定期週期性更新.

大部分內容在我的twitter都會有,這邊只是將一些簡單的心得與感想註解一下.

本週摘要

本週工作上有個里程碑,很開心夥伴們能夠準時的交付出產品.雖然我們也踩了不少雷,不過我們完成了!!

目前一邊在看 udacity 的 Introduction Machine Learning 一邊也跟著公司同事們學習相關論文.相當充實!!



Go

Contributing to the Go project

2016 的舊文章,不過很實用.

由於 Go 專案都是放在 Gerrit 想要貢獻給 #golang 專案,卻又不知道該如何開始? 這篇文章提供一整個流程的介紹,幫助你可以提交你的第一個 PR 給 Golang, 來看看這篇文章吧

有人幫忙精選了在 2016 的九篇最受歡迎的 Golang 相關文章,其中前五篇是:

Grumpy: Go running Python!

Google open source 為了解決很多 legacy 的 python code ,開發了一個工具可以讓你將 Python 轉換成 Go ,或是在 python 裡面跑 go 的套件.

一些重點整理:

  1. Grumpy (脾氣暴躁 XD) 把 令人討厭的 GIL (Global interpreter lock) 拿掉了.換成 Go 的 GC 來管理.可以讓跑 python 的時候 multiple thread 更快. Grumpy 也不是第一個把 GIL 拿掉的 Python runtime, IronPython/Jython 都這樣幹過

  2. 目前 Grumpy 支援度不夠,所以大家使用前看一下 issue list (光是 import “/”, “.” 就有些問題 refer issue 11)

  3. Grumpy 不知道 CPython 的部分,所以 numPy 跟 opencv 都不能用. (其實還不少不能用的,畢竟還 alpha)

  4. 也是可以跑 Interactive shell “make run” 就可以了…

  5. 目前僅支援 python 2.7 (畢竟還有四年可以活 XD)

最後,為了呼應拿掉 GIL , Russ Cox 也發了篇十年前的 C 與顏文章.來解釋 lock 有多痛苦 XDDD

想清楚了解 Python GIL 是什麼,可以看看這篇 slide



Python



Android/JAVA/NODE.JS/Scala

Migration From Spark 1.x to Spark 2.x

如何將你手邊 Spark 1.x 的代碼移植到 Spark 2.x 裡面.有些 package 位置有換得的部分要注意一下.



Docker



Kubernetes

Setting up OpenAI’s Kubernetes EC2 autoscaler in the cluster installed by kops

同事寫的相關安裝文件,整理的不錯.



iOS/Swift



其他程式語言

Rust: Reword ‘stupid’ and ‘crazy’ in docs.

如何在文件中把一些比較激進的文字修改成比較溫和的文字 XDD



論文收集



網站文章

【长城】原来是一部细思极恐的IT大片

雲端架構師如何來看”長城”這部賀歲大片. HA 的怪是哪招? XDD



Machine Learning

berkeley 2017 春季的 Deep Reinforcement Learning 課程

Breaking things is easy

Nicolas Papernot 和 Ian Goodfellow 探討機器學習模型的資安問題,本文列出了三招,摘要如下:

  1. 對資料集下毒:在已上線的模型中,餵幾個最能增加模型預測錯誤的資料點。例如莫里雅提教授送福爾摩斯穿一雙新鞋子,讓警方認為那雙鞋子就是福爾摩斯穿的,接著莫再穿著另一雙一樣的鞋子去犯案,來入罪福爾摩斯。
  2. 惡意輸入讓模型預測錯誤:例如一隻熊貓加上一些人眼無法察覺的雜訊,可讓機器預測為長臂猿。要使用這種攻擊需要知道模型參數
  3. 隱私問題:壞人的目標是想辦法取得一部分帶有使用者隱私的訓練資料,或是觀察模型的預測來擷取隱私。例如觀察智慧型手機鍵盤輸入的預測,可以約略知道使用者常打什麼關鍵字。

(以上文字轉錄自 智程梁)

Learning from Simulated and Unsupervised Images through Adversarial Training

Apple 發表的第一篇跟 Machine Learning 相關的論文,內容圍繞著 GAN 與影像處理.

Matching networks for one shot learning

Morning Paper 是每天會幫你讀一篇論文,然後寫下導讀跟心得. 今天談如何透過極少的object 來做分類



有聲書/影片心得





程式設計週記[2016/12/29]: 年底到了,先來點今年完成了哪些吧

這是什麼?

程式週記主要內容如下:

Gihub project 介紹:

  • 主要會貼一些github,但是會盡量寫上一些有用的評語(或是我容易想到的關鍵詞)幫助以後查詢

網路文章心得:

  • 會寫些心得,強迫自己閱讀.

“程式週記”並且定期週期性更新.

大部分內容在我的twitter都會有,這邊只是將一些簡單的心得與感想註解一下.

本週摘要

年底到了,先盤點一下,今年達成的目標:

  • COSCUP 講者
  • Modern Web 講者
  • GOOGLE DevFest Taipei 講者
  • Organize GolangTW meetup
  • 完成 Project 52
  • 修完 2 堂 Moocs

除了完成的部分,也該盤點一下把自己的 Coursera, EDX, Udacity 上面還沒修完的課程.得要把他們都修完才對:

  • Coursera: Cloud Computing Part 1. 學習 Gossip 的好課程,一定要好好把他修完.
  • Coursera: Machine Learning. Andrew Ng 的經典課程,上了幾個禮拜就停住,一樣得好好學學.
  • Udacity: Machine Learning入門. 算很基礎的課程,搭配 SKLearn .應該會比 Andrew Ng 的課程還早修完.



Go

Enigma emulator in Go

Enigma 就是二次世界大戰德國用來加解密的機器,德國透過 Enigma 來加解密相關軍事訊息來傳送給友軍.

這個模擬器試著要透過 Golang 模擬 Enigma 的功能,很有趣.

geohot/lolrecaptcha: We try to break the recaptcha for the Merry Christmas for all!

喬治·霍茲 (geohot) 是美國的知名駭客,目前在 Google 的 Zero Project 團隊中專門發現所謂的 Zero-Day Bug.

之前比較知名的事件就是他是第一個破解 iOS 跟 PS3 的人,並且也開源了 comma.ai

在聖誕節前夕,他忽然想來學 Golang,於是就把 recaptcha (Google 開發的是否是機器人的判斷器) 破解了.

快來看看他怎麼破解的..

Testing distributed systems in Go

Golang 是最容易拿來撰寫分散式系統的語言(之一),這篇文章拿了 etcd (CoreOS 開發的分散式 K/V 資料庫) 為範例來講解如何測試.

裡面提到不少測試的新法,比如說:

  • 砍掉任意節點
  • 砍掉任意 Leader 節點
  • 砍掉超過多數的節點
  • 砍掉全部節點…

也有提供該如何砍掉 node 的 sample code .

這篇文章相當適合想寫分散式系統的人好好閱讀,也希望大家會喜歡.

GopherVids

這邊有搜集了所有的 Golang 的相關演講的影片,你可以透過講者與時間來做簡單的搜尋與分類.

來看看吧,一定能找到你想要看的演講影片



Python



Android/JAVA/NODE.JS/Scala



Docker



Kubernetes



iOS/Swift



其他程式語言



論文收集



網站文章

The 12 Most Retweeted Programming Quotes

12 個最常被轉 tweet 的經典程式設計師語錄. Programming Wisdom 是一個 twitter 上面相當知名的程式設計師語錄.這篇文章精選了 12 個最多人歡迎的 tweeet 並且解釋了其中的內容.



Machine Learning

Deep Learning: An MIT Press book

這是一本相當知名的 Deep Learning 書籍,作者就是 Ian Goodfellow (深度學習的大師,也就是生成式對抗網絡 GAN: Generative Adversarial Networks 的作者之一).

這本書在 Amazon 有販賣紙本,當然也可以在這個地方直接線上閱讀. 作者也有提供投影片可以觀看.

如果有興趣,也可以跟 chihcheng.liang 一起來讀這本

自上而下的学习路线: 软件工程师的机器学习

軟體工程師想要自學 Machine Learning 所記錄的所有心路歷程與相關資源.很適合想要自學的人來看看.

近200篇機器學習&深度學習資料分享

兩百篇精選的 Machine Learning 相關資源(也附上相關的中文翻譯) . 很多文章都相當的經典,很推薦好好讀讀.



有聲書/影片心得





程式設計週記[2016/12/23]: 把握時間,珍惜你愛的

這是什麼?

程式週記主要內容如下:

Gihub project 介紹:

  • 主要會貼一些github,但是會盡量寫上一些有用的評語(或是我容易想到的關鍵詞)幫助以後查詢

網路文章心得:

  • 會寫些心得,強迫自己閱讀.

“程式週記”並且定期週期性更新.

大部分內容在我的twitter都會有,這邊只是將一些簡單的心得與感想註解一下.

本週摘要

最近家人得了癌症,就深刻地了解到健康的重要.

“時間”,“愛”與“死亡“緊緊的將我們串連在一起 這句話其實是最近已經上映的電影 “最美的安排 (ollateral Beauty)“裡面的一句話.

我們真的要好好的珍惜我們擁有的時間與愛才能幫助我們正確地面對死亡.

不論你信仰是哪一種神,最公平的就是每個人一天就是 24 個小時,不會因為你是身份,種族與性別有何不同. 如何把握每一天,好好運用這上篇天給予我們的禮物就格外重要.



Go

Who needs generics? Use … instead!

介紹 generics 基本定義,如何在 go 用其他方式取代。

大家都知道 Golang 不支援 generics 如果程式就是需要怎麼辦? 這邊介紹一些心法。

minaandrawos/machat : An open source chat server implemented in Go

透過 Golang 完成的一個聊天室伺服器,還有 client 端

jpoz/gomeme: Command line double caption meme generator. Written in Go (Golang)

將 GIF 加上一段有趣的上標跟下標,做成 MEME GIF.

The 12 Factors of Go

12FA (12 factor app) 是 heroku 提出建制 modern app 的方法論。 這篇作者試著用 Go 與 Docker 來實作並且寫了一本書

piladb: Lightweight RESTful database engine based on stack data structures

piladb (pila: 就是西班牙文的 stack): PilaDB 是一個輕量化的 RESTful DB ,並且提供 stack structure 的架構,也就是說你可以透過 Push/Pop 來存取資料.



Python



Android/JAVA/NODE.JS/Scala

PMML model export - RDD-based API

Exploring Spark MLlib: Part 4 – Exporting the model for use outside of Spark

如何把 model 輸出,載入再加上預測.

Apache Spark 2.0 Preview: Machine Learning Model Persistence

2.0 machine learning 輸出與輸入的方式…



Docker



Kubernetes

深度学习框架TensorFlow在Kubernetes上的实践

這一篇文章稍微簡單的介紹 Tensorflow 與 Deep Learning ,並起稍微簡介了 Tensorflow 的工作流程.

既然 Tensorflow 已經支援了 cluster mode ,那為何還需要 Kubernetes 呢? 主要原因如下:

  • Storage
  • Failure Recovery
  • Task Monitoring
  • Resource Management
  • Tensorflow Cluster mode will not terminal after job finised (tentative)

算是初步入門文章

Why Red Hat makes more money on Docker than Docker does

“Redhat 透過 Docker 賺的錢,比 Docker 自己都還要多”

這篇章從商業的角度上來探討為何 Docker 很難賺到錢,相反的身為系統服務商 Redhat 卻透過 OpenShift 賺進大筆的鈔票 ($2 billion in annual revenue ).

本文中認為 OpenShift 其實在內容上跟 Docker Datacenter 的服務並沒有太大差異,而 Redhat 憑著是良好的 Docker Container 的運作熟悉度 ( BTW: Redhat 是第二大的 Docker opensource 的貢獻者) 搭配著 Kubernetes 在底層的服務就賺進了大筆的器業服務與諮詢費.

常跟幾個商業夥伴在笑說, Redhat 的服務費是很貴,那是因為當以要找他的時候,就是你需要服務( 解 Bug ) 的時候.所以就像是軟體服(ㄌ ㄜ )務(ㄙ ㄨ ㄛ \/ ) 費一樣.



iOS/Swift



其他程式語言

How to include graphviz graphs in github README

如何在 Github Readme 裡面使用 graphviz 系列的向量與流程圖語言.



論文收集



網站文章



Machine Learning

Splunk+蜜罐+防火墙=简易WAF

透過 Splunk (相當快速的資料分析工具) 來收集所有的 syslog 來分析所有的網路流量,如果看到有異常的狀況,就會報警出來.

並且架設一個蜜罐 ( 一個無防禦的漏洞,但是不會實際損害到主機的端口 ) 來收集所有可能是惡意攻擊的連線,交給 Splunk 來分析.

透過 Splunk 跟 蜜罐能達到什麼? 就可以建置一個類似於 WAF 全文為「Web Application Firewall」,可以直接翻譯成「網路應用程式防火牆」或「網站應用程式防火牆」,這邊有詳細的介紹

如何成为一名人工智能产品经理?

這篇文章主要介紹做一個 AI(ML) 的 PM 與一般軟體(或是服務)的差別在哪裡,如何做好一個?

也會一並建議如何自我進修的部分.

引用 Andrew Ng 的一段話:

「对我而言,无论何时,当我觉得我不知道下一步应该如何做的时候,
我将会尝试大量的学习和阅读,和某些领域的专家谈话。我不知道我们
的大脑是如何工作的,但它非常的神奇:当你读了足够多的书,或者和
足够多的专家谈话之后,换句话说,当你的大脑有了足够多的输入信
息,新的想法就会随之产生。」

OpenAI: Infrastructure for Deep Learning

OpenAI (一個提供平台給大家做 AI 練習的公司) 公佈了他們的基礎架構,一個基於 Kubernets 所部署出來的分散式的 Tensorflow .

這篇文章除了介紹 Tensorflow 之外,也介紹了一個透過 Deep Learning 完成的範例. 其中系統架構是透過 Kubernetes 加上分散式的 Tensorflow cluster ,並且透過 Kubernetes-ec2-autoscaler 來做到機器的 Auto-Scaler .



有聲書/影片心得



程式設計週記[2016/12/15]: 讓我們來裝裝 Container Linux

這是什麼?

程式週記主要內容如下:

Gihub project 介紹:

  • 主要會貼一些github,但是會盡量寫上一些有用的評語(或是我容易想到的關鍵詞)幫助以後查詢

網路文章心得:

  • 會寫些心得,強迫自己閱讀.

“程式週記”並且定期週期性更新.

大部分內容在我的twitter都會有,這邊只是將一些簡單的心得與感想註解一下.

本週摘要

有幸跟著老闆去見客戶與生意夥伴,讓我的視野又高了不少,也著實見識到 CEO 們每個人都是活力十足的人. 再次感謝老闆願意給這樣的機會.

雖然這個禮拜都在談事情跟開會,不過還是抽空完成 Golang 的 LUIS 套件.接下來會找時間開發一個跟 LUIS 結合的自我學習 Chatbot.

這個禮拜看的文章有點少,要檢討….



Go

Golang Line Bot with Azure/AWS with Let’s encrypt

  • Azure(Amazon)申租免費 VM。
  • FreeDNS 申請免費 Domain Name。
  • 透過 lego 申請 Let’s Encrypt 免費憑證。
  • 我之前的 Line Bot Template

裡面也有提到 Lego

Lego: Let’s Encrypt client and ACME library written in Go

這個專案提到如何透過 ACME 來使用 Let’s Encrypt 的認證.好消息是這個已經在 process 看看會不會進入 http/net 基本的 package 之中.

I was offered 1 million for my Go package — and I said No.

有人寫了一個 Golang package 被詢問以 $1 million 的現金加上股票賣出, 但是被作者拒絕。來看看作者怎麼想。

tsenart/vegeta: HTTP load testing tool and library. It’s over 9000!

使用超級賽亞人 ( 貝吉塔 / ベジータ) 來壓測你的線上服務。 這個專案 star 數 (戰鬥力) 超過 4000 啊…

Some Tools For Go That You Might Not Know Yet

你可能还不知道的一些 Go 语言工具 (Some Tools For Go That You Might Not Know Yet) :

中文可见



Python



Android/JAVA/NODE.JS/Scala



Docker



Kubernetes

Self-Driving Kubernetes, Container Linux by CoreOS and Kubernetes 1.5

CoreOS 將自己的 Linux 版本從 CoreOS 改名為 “Container Linuex”

CoreOS 被 Google 投資後不斷著在 Container 技術與 Kubernetes 上面做出相當多的貢獻,不論是主辦TECTONIC 2016 Summit 來談論如何企業化 Kubernetes ,或是這篇最新的消息. CoreOS 嚴然變成 Kubernetes 最大的贊助廠商.



iOS/Swift



其他程式語言



論文收集



網站文章



Machine Learning



有聲書/影片心得



我最近完成的程式碼

Microsoft Luis.ai API Golang package https://www.luis.ai

花了幾天的時間,稍微把微軟的 LUIS.AI Golang package 包裝好了. 主要可以讓大家透過 LUIS Golang 套件來做以下事情:

  • 增加一個新的語句(utterances)
  • 訓練模型
  • 透過已經訓練好的模型來預測結果
  • 選出最高分的結果

目前僅僅完成我需要用的接口,還需要大家的幫忙能夠讓它更好!!



程式設計週記[2016/12/08]: 本週是滿滿的 AI 大平台的開源週 : OpenAI VS DeepMind

這是什麼?

程式週記主要內容如下:

Gihub project 介紹:

  • 主要會貼一些github,但是會盡量寫上一些有用的評語(或是我容易想到的關鍵詞)幫助以後查詢

網路文章心得:

  • 會寫些心得,強迫自己閱讀.

“程式週記”並且定期週期性更新.

大部分內容在我的twitter都會有,這邊只是將一些簡單的心得與感想註解一下.

本週摘要

好幾週沒整理文章,其中有去參加 GDGDev Fest Taipei 2016的演講.也有跑去參加 Chatbot Meetup 的演講.

最近有人在問我,還有沒有再寫 Code?

現在大部分的時間都是花在管理團隊跟時程還有產品討論.如果真的需要我寫代碼,其實都是自己想寫啊.名義上可能是說參加社群跟寫代碼都是自己想做的事情.所以都會自己用晚上的時間來做.

不過公司裡面都是社群大大,所以大家都蠻能體諒.加上大伙兒興趣也都一樣,做起事情來也特別的開心啊.就算犧牲晚上睡眠也是開開心心的. XDD



Go

google/gops: A tool to list and diagnose Go processes currently running on your system

gops 可以分析你目前跑的 golang app ,可以分析到所有的記憶體狀況外.甚至是 goroutine 都可以分析.

Go’s alias proposal and all my concerns of Google controlling Go

Go vendor 討論與 google 是否控制 Golang

Encrypted Configuration in Go

透過 Golang module 來講環境設定加密的方法 Kms Golang

grpc-go

在幾天前把使用的版本更新到 #golang 1.7.1 之後,據說有顯著的效能提升.

A note on the version used: significant performance improvements in benchmarks of grpc-go have been seen by upgrading the go version from 1.5 to the latest 1.7.1.

FromXToGo

如果你正從某個語言( java, Python, ruby. …) 想要換到 Golang 卻又害怕嗎?

這邊有一連串文章搜集好相關的故事,可以給你們一切參考。

Go - First Impressions

有人分享他自己對於 #golang 的第一印象

IronFunctions - the serverless microservices platform. http://iron.io

Iron.io 一直以來都是強力推動 Golang 的公司,現在他們提出了新的產品。 iron.io functions 一個基於 Golang 的 serverless 的平台。

How to write your own Go tool by Fatih Arslan

Fatma Arslan (vim-go 的作者) 介紹了如何透過 go/ast go/parser 與 go/printer 來製作 golang 的小工具,並且透過 gofmt 的 use case 來解釋如何透過這些工具來製作.

Introducing Distributed Cheese: Traefik 1.1 Camembert Is Out!

Træfɪk 是一個用 #golang 打造的 HTTP reverse proxy 跟 load balancer 具有高效能與友善的使用介面。 在最新的版本中支援了 docker swarm mode 跟 mesos. 快來看看

Go 1.8 toolchain improvements

Dave Cheney 解釋預計在 2017/01/31 將要釋出的 Go 1.8 主要在 toolchain 上的優化. 其中包含有:

編譯得更快: Go 1.7 就支援了 SSA(Static single assignment) 但是由於相容舊的方式,留了不少舊的架構. 1.8 完成了所有的優化並且拔光舊有的架構. 可以讓你編譯得更快, 雖然比不上 Go 1.4 (因為當時用 C 來做底層 Compiler 1.5 之後換成 Go 原生來編譯 Compiler ) ,但是也有長足的進步.

Code Generation 的優化: 對於 Code 分析與產生 (go gen) 有著些許的優化與速度提升.

Defer 與 cgo 的效能提升: Defer 提升 33% 而 cgo 提升 45%

平台支援: Go 1.7 支援 64-bit mips, Go 1.8 支援 32-bit mips

https://blog.pusher.com/golangs-real-time-gc-in-theory-and-practice/ 這篇文章敘述了一個從 Haskell 轉到 Golang 的工程師分析對於 GC (Garbage Collection) 的理論與實務上說明.

不僅僅有一段對於 GC 的動態展示,還有相關代碼可以了解 GC 變化的狀況.很推薦大家好好了解一下基本原理.

GDG DevFest Taipei 2016 - In Love with Golang

GDG Dev Fest 是 Google Developer Group Festival Taipei ( Google 開發者群組嘉年華會 ) GDG DevFest 之前在 GTG 有人問我,為何大家投影片不用 Golang Present 來做.所以我為了 GDG Dev Fest 做好了 Golang Talk 的投影片.

這是 GDG DevFest Taipei 2016 的投影片. 我要坦誠我不是使用 GDG DevFest 的官方版面,因為我使用 #Golang 的投影片工具 - “Present”. 週六內容主要圍繞在介紹 Golang 的優點與特性 與分享 Golang 如何改變我對於 Programming 的想法.

希望這些內容能夠改變一些人,也希望能讓大家更了解 Golang 的優點.



Python



Android/JAVA/NODE.JS/Scala



Docker



Kubernetes

In 13 minutes from Kubernetes to a complete application development tool



iOS/Swift



其他程式語言



論文收集



網站文章



Machine Learning

[DSC × TAAI 2016] 李宏毅 / 一天搞懂深度學習

資料者年會的教材,如何一天搞懂深度學習.

[DSC x TAAI 2016] 林守德 / 人工智慧與機器學習在推薦系統上的應用

comma.ai for the people to experiment with

comma.ai 提供一個無人車自動駕駛的 AI 系統,他們開放了他們 AI 方面的原始馬來提供給大家試試看.包括自動跟車等等系統都在裡面.

開放項目還包括了 80 G 的 Dataset (包括七小時十五分的駕駛資料還有其他的) ,系統使用 Anaconda, Tensorflow 與 CV2. 很有趣的專案.

這個專案有以下特性:

  • 不需要建模與圖形函數 (CV2 僅僅拿來比對相片相似度)
  • 適用於小解析度相機 (160 x 320 灰階)
  • 透過 RNN 來分析

Open-sourcing DeepMind Lab

這兩個月最紅的 (ML) 新聞之一,大概就是以 AlphaGo 打敗世界棋王而聞名的 DeepMind .要把他們的 3D 平台的實驗室開源了,這一個 3D 平台中,使用者(玩家)就是擔任裡面的一個浮在空中的攝影鏡頭,並且可以在裡面解開一些謎題.

是不是有點熟悉? 沒錯!就是類似於 OpenAI 的方式.

目前代碼已經開源在 Github
懶得看英文? 這裡有中文

題外話:

此外,其實大家都會想說 DeepMind 下一步是不是要挑戰 3D 遊戲呢?

其實早在三四個月前,就已經有 Data Scientist 研究透過 Reinforcement Learning (Q-Learning) 來玩 DOOM (毀滅戰士) 的 Deadmatch 模式,相關網址

方式是透過兩個邏輯:

  1. 遇敵邏輯: 就是經由 3D 圖像的判斷,透過 Q-Learning 來自我學習如何透過最少的時間找到敵人.

  2. 戰鬥邏輯: 一樣是透過 Q-Learning 的方式來找尋到最好的戰鬥方式.

只是這次 Deepmind 想要挑戰什麼?大家可以猜猜!!

DeepMind AI Reduces Google Data Centre Cooling Bill by 40%

補充一個題外話:

其實 Deepmind 雖然為人所知的就是 AlphaGo 打敗世界棋王,其實前幾個月 ( 2016/07 ) 也公布另外一篇文章.就是講解 Deepmind 透過 AI 的方式來省掉 40% 的冷氣電費.

其實 Google Datacenter 很省電一直都不是秘密,這也是為什麼 GCP 可以比其它同業便宜的原因. ( GCPUG.TW(Google Cloud Platform User Group Taiwan))

這邊有個有趣的舊聞:

https://www.google.com/about/datacenters/efficiency/external/index.html#best-practices

這個鏈結裡面有 Google Datacenter 省電的方式,裡面有

  1. Measure PUE: 仔細分析 PUE 2.Manage airflow: 管理冷氣的通道
  2. Adjust the thermostat: 調整溫度控制
  3. Use free cooling: 使用天然冷氣
  4. Optimize power distribution: 透過 將 UPS 放在主機上,來減少 AC/DC 轉換

其中… 如果你去搜尋 AC/DC 的話就會找到一個知名人士

恩恩… 就是 「智慧城市委員會」顧問 - (翟神)翟本喬

Sega - 人工智慧的現況與未來

Liveouse.in CEO Sega 整理的投影片,其實內容相當的充足而有條理.滿適合不太了解的人閱讀.



有聲書/影片心得