0%

Caffe全称是Convolutional Architecture for Fast Feature Embedding(卷积神经网络框架),是一个清晰、高效的深度学习框架。它是开源的,核心语言是C++,支持命令行、Python和Matlab接口,既可以在CPU上运行也可以在GPU上运行。

本文实现在Ubuntu16.04下深度学习框架caffe + cuda8.0 + cudnn5.1 + opencv3.2.0的搭建,并对搭建过程中的诸多问题进行总结。

阅读全文 »

OpenCV是一个基于BSD许可(开源)发行的跨平台计算机视觉库,可以运行在Linux、Windows、Android和Mac OS操作系统上。它轻量级而且高效——由一系列 C 函数和少量 C++ 类构成,同时提供了Python、Ruby、MATLAB等语言的接口,实现了图像处理和计算机视觉方面的很多通用算法。

本文将使用python3.6,通过调用OpenCV库来实现图像处理几个方面的功能。

阅读全文 »

FFmpeg是一个开源的多媒体库,使用非常广泛。FFmpeg在Linux平台下开发,但它同样也可以在其它操作系统环境中编译运行。

本文使用FFmpeg + MinGW(MSYS) + Yasm + VS2017 的技术路线来完成FFmpeg在Windows 10(64bit)下的编译,并参考相关学习文档,使用c++语言编写一个简单的编码程序,通过调用FFmpeg库中开源.h及.dll文件,实现yuv格式视频文件的h.264编码。

阅读全文 »

LZW 压缩技术由以色列人 Lempel 和 Ziv 共同提出,美国人 Welch 将其从概念发展到实用阶段。LZW使用字典库查找方案。它读入待压缩的数据并与一个字典库(库开始是空的)中的字符串对比,如有匹配的字符串,则输出该字符串数据在字典库中的位置索引,否则将该字符串插入字典中。LZW广泛应用于无损数据压缩,包括无损图像压缩领域,包括 GIF、TIFF、PNG 等格式图像文件。

本篇文章使用Python3.6工具、win10(64bit)环境,实现LZW的编码及解码流程,并测试编解码效果。除此之外,提出一些改进的想法,并作简单分析与思考。

阅读全文 »