GitHub热门项目ClickHouse:在Windows 10环境下的安装与使用

云信安装大师
90
AI 质量分
10 5 月, 2025
2 分钟阅读
0 阅读

GitHub热门项目ClickHouse:在Windows 10环境下的安装与使用

引言

ClickHouse是Yandex开源的列式数据库管理系统,因其出色的分析查询性能而成为GitHub上的热门项目。本文将详细介绍如何在Windows 10环境下安装和使用ClickHouse,即使你是数据库新手也能轻松上手。

准备工作

在开始之前,请确保你的系统满足以下要求:
– Windows 10(64位)
– 至少4GB内存(推荐8GB以上)
– 20GB可用磁盘空间
– PowerShell 5.1或更高版本

安装步骤

方法一:使用Docker(推荐)

这是最简单的方法,适合大多数用户。

  1. 安装Docker Desktop

    • Docker官网下载并安装
    • 安装完成后启动Docker服务
  2. 拉取ClickHouse镜像
    打开PowerShell,执行以下命令:

    代码片段
    # 拉取最新版ClickHouse服务器镜像
    docker pull yandex/clickhouse-server
    
    # 拉取ClickHouse客户端镜像
    docker pull yandex/clickhouse-client
    
  3. 运行ClickHouse容器

    代码片段
    # 启动ClickHouse服务器
    docker run -d --name some-clickhouse-server --ulimit nofile=262144:262144 -p 8123:8123 -p 9000:9000 -p 9009:9009 yandex/clickhouse-server
    
    # 连接到服务器(在另一个终端窗口)
    docker run -it --rm --link some-clickhouse-server:clickhouse-server yandex/clickhouse-client --host clickhouse-server
    

方法二:原生Windows安装

如果你想直接在Windows上运行:

  1. 下载预编译包
    访问官方发布页面,下载最新版本的clickhouse-xxx-windows-amd64.zip

  2. 解压并配置
    解压到C:\ClickHouse目录,然后创建配置文件:

    代码片段
    # 创建数据目录
    mkdir C:\ClickHouse\data
    
    # 创建配置文件config.xml(示例内容见下文)
    

    示例config.xml内容:

    代码片段
    <yandex>
        <logger>
            <level>trace</level>
            <log>/var/log/clickhouse-server/clickhouse-server.log</log>
            <errorlog>/var/log/clickhouse-server/clickhouse-server.err.log</errorlog>
        </logger>
    
        <http_port>8123</http_port>
        <tcp_port>9000</tcp_port>
    
        <path>C:/ClickHouse/data/</path>
        <tmp_path>C:/ClickHouse/tmp/</tmp_path>
    
        <users_config>users.xml</users_config>
        <default_profile>default</default_profile>
        <default_database>default</default_database>
    
        <mark_cache_size>5368709120</mark_cache_size>
    </yandex>
    
  3. 启动服务

    代码片段
    cd C:\ClickHouse\
    .\clickhouse-server.exe --config-file=config.xml
    
    # 在另一个终端启动客户端
    .\clickhouse-client.exe --port=9000
    

ClickHouse基本使用

成功连接后,让我们尝试一些基本操作:

  1. 创建数据库
代码片段
CREATE DATABASE test_db;
USE test_db;
  1. 创建表
代码片段
CREATE TABLE user_actions (
    user_id UInt32,
    action_date Date,
    action_type String,
    duration Float32,
    device String DEFAULT 'unknown'
) ENGINE = MergeTree()
ORDER BY (user_id, action_date);
  1. 插入数据
代码片段
INSERT INTO user_actions VALUES 
(101, '2023-01-15', 'login', 2.5, 'mobile'),
(101, '2023-01-15', 'view', 15.2, 'desktop'),
(102, '2023-01-16', 'purchase', NULL, 'mobile');
  1. 查询数据
代码片段
-- 简单查询
SELECT * FROM user_actions;

-- GROUP BY查询示例
SELECT 
    toStartOfMonth(action_date) AS month,
    count() AS actions,
    avg(duration) AS avg_duration,
    uniq(user_id) AS unique_users
FROM user_actions 
GROUP BY month 
ORDER BY month DESC;

Windows环境下的注意事项

  1. 性能优化

    • ClickHouse在Windows上的性能不如Linux,建议仅用于开发和测试
    • SSD硬盘能显著提升性能
  2. 常见问题解决

    问题:端口冲突错误
    解决方案:

代码片段
# 查看占用端口的进程(如8123)
netstat -ano | findstr :8123

# kill掉相关进程(替换PID)
taskkill /PID [PID] /F
  1. 数据备份
代码片段
# Docker方式备份数据目录到当前文件夹(先停止容器)
docker cp some-clickhouse-server:/var/lib/clickhouse ./backup_data

# Windows原生方式直接复制C:\ClickHouse\data目录即可

ClickHouse可视化工具推荐

  1. DBeaver:支持多种数据库的通用工具
  2. Tabix:专为ClickHouse设计的Web界面
  3. DataGrip:JetBrains出品的高级数据库工具

总结

本文介绍了在Windows 10环境下安装和使用ClickHouse的两种主要方法:
1. Docker方式简单快捷,适合快速体验和开发环境
2. Windows原生方式更贴近生产环境配置

关键点回顾:
– ClickHouse是高性能的列式分析数据库
– Windows环境需要特别注意路径和权限设置
– Docker方式能避免很多环境配置问题

希望这篇指南能帮助你顺利开始使用这个强大的分析数据库!如有任何问题,欢迎在评论区讨论。

原创 高质量