gaoteng's blog

Ubuntu16.04+CUDA8.0+Cudnn5.1+Opencv3.2.0+Caffe框架的搭建

发表于 2018-01-12 更新于 2022-09-03

Caffe全称是Convolutional Architecture for Fast Feature Embedding（卷积神经网络框架），是一个清晰、高效的深度学习框架。它是开源的，核心语言是C++，支持命令行、Python和Matlab接口，既可以在CPU上运行也可以在GPU上运行。

本文实现在Ubuntu16.04下深度学习框架caffe + cuda8.0 + cudnn5.1 + opencv3.2.0的搭建，并对搭建过程中的诸多问题进行总结。

阅读全文 »

OpenCV在图像处理方面的应用

发表于 2017-12-27 更新于 2022-09-03

OpenCV是一个基于BSD许可（开源）发行的跨平台计算机视觉库，可以运行在Linux、Windows、Android和Mac OS操作系统上。它轻量级而且高效——由一系列 C 函数和少量 C++ 类构成，同时提供了Python、Ruby、MATLAB等语言的接口，实现了图像处理和计算机视觉方面的很多通用算法。

本文将使用python3.6，通过调用OpenCV库来实现图像处理几个方面的功能。

阅读全文 »

h264编码器实现

发表于 2017-07-09 更新于 2022-09-03

FFmpeg是一个开源的多媒体库，使用非常广泛。FFmpeg在Linux平台下开发，但它同样也可以在其它操作系统环境中编译运行。

本文使用FFmpeg + MinGW(MSYS) + Yasm + VS2017 的技术路线来完成FFmpeg在Windows 10(64bit)下的编译，并参考相关学习文档，使用c++语言编写一个简单的编码程序，通过调用FFmpeg库中开源.h及.dll文件，实现yuv格式视频文件的h.264编码。

阅读全文 »

lzw编解码实现

发表于 2017-07-04 更新于 2022-09-03

LZW 压缩技术由以色列人 Lempel 和 Ziv 共同提出，美国人 Welch 将其从概念发展到实用阶段。LZW使用字典库查找方案。它读入待压缩的数据并与一个字典库（库开始是空的）中的字符串对比，如有匹配的字符串，则输出该字符串数据在字典库中的位置索引，否则将该字符串插入字典中。LZW广泛应用于无损数据压缩，包括无损图像压缩领域，包括 GIF、TIFF、PNG 等格式图像文件。

本篇文章使用Python3.6工具、win10(64bit)环境，实现LZW的编码及解码流程，并测试编解码效果。除此之外，提出一些改进的想法，并作简单分析与思考。

阅读全文 »