C语言哈希表实现：线性探测法深度解析

今日目标

理解哈希表的基本概念和工作原理

掌握线性探测法的冲突解决机制

学会用C语言实现完整的哈希表

了解哈希函数的设计原则

掌握内存管理和性能优化技巧

哈希表概述

哈希表是最高效的数据结构之一，在快速查找、插入和删除操作方面表现出色。本文将从头开始实现一个简单的C语言哈希表，使用开放寻址法中的线性探测来解决冲突。

我们将涵盖：

使用结构体创建键值对

简单的字符串哈希函数

线性探测的冲突解决

插入、搜索和删除操作

完整的演示和解释

数据结构设计

哈希表项结构

#define TABLE_SIZE 100
typedef struct {
char* key; // 键（字符串）
int value; // 值（整数）
int isOccupied; // 槽位状态：0=空，1=占用，-1=已删除
} HashItem;
HashItem table[TABLE_SIZE]; // 全局哈希表

状态标记说明

0 (空): 槽位从未被使用过

1 (占用): 槽位当前存储着有效数据

-1 (已删除): 槽位之前被使用过但已被删除（墓碑标记）

哈希函数设计

基本字符串哈希函数

unsigned int hash(const char* key) {
unsigned int hash = 0;
while (*key) {
hash = (hash * 31) + *key++; // 简单哈希逻辑
}
return hash % TABLE_SIZE;
}

哈希函数特点

使用31作为乘数（质数，减少冲突）

逐字符计算哈希值

通过模运算确保索引在有效范围内

返回0到TABLE_SIZE-1之间的索引

插入操作实现

线性探测插入逻辑

void insert(const char* key, int value) {
int index = hash(key);
int originalIndex = index;
// 线性探测：处理冲突
while (table[index].isOccupied == 1 && strcmp(table[index].key, key) != 0) {
index = (index + 1) % TABLE_SIZE;
if (index == originalIndex) {
printf("哈希表已满！\n");
return;
}
}
// 插入或更新
if (table[index].isOccupied != 1) {
table[index].key = strdup(key); // 将键复制到堆内存
table[index].value = value;
table[index].isOccupied = 1;
} else {
table[index].value = value; // 如果键已存在则更新值
}
}

查找操作实现

搜索函数

int get(const char* key) {
int index = hash(key);
int originalIndex = index;
// 线性探测搜索
while (table[index].isOccupied != 0) {
if (table[index].isOccupied == 1 && strcmp(table[index].key, key) == 0) {
return table[index].value;
}
index = (index + 1) % TABLE_SIZE;
if (index == originalIndex) {
break;
}
}
return -1; // 未找到
}

删除操作实现

删除函数

void delete(const char* key) {
int index = hash(key);
int originalIndex = index;
while (table[index].isOccupied != 0) {
if (table[index].isOccupied == 1 && strcmp(table[index].key, key) == 0) {
free(table[index].key); // 释放内存
table[index].key = NULL;
table[index].isOccupied = -1; // 标记为已删除
printf("已删除 '%s'\n", key);
return;
}
index = (index + 1) % TABLE_SIZE;
if (index == originalIndex) {
break;
}
}
printf("未找到键 '%s'。\n", key);
}

完整实现示例

主程序演示

#include <stdio.h>
#include <stdlib.h>
#include <string.h>
#define TABLE_SIZE 100
typedef struct {
char* key;
int value;
int isOccupied;
} HashItem;
HashItem table[TABLE_SIZE];
// 初始化哈希表
void init_table() {
for (int i = 0; i < TABLE_SIZE; i++) {
table[i].key = NULL;
table[i].value = 0;
table[i].isOccupied = 0;
}
}
// 哈希函数
unsigned int hash(const char* key) {
unsigned int hash = 0;
while (*key) {
hash = (hash * 31) + *key++;
}
return hash % TABLE_SIZE;
}
// 插入函数
void insert(const char* key, int value) {
int index = hash(key);
int originalIndex = index;
while (table[index].isOccupied == 1 && strcmp(table[index].key, key) != 0) {
index = (index + 1) % TABLE_SIZE;
if (index == originalIndex) {
printf("哈希表已满！\n");
return;
}
}
if (table[index].isOccupied != 1) {
table[index].key = strdup(key);
table[index].value = value;
table[index].isOccupied = 1;
} else {
table[index].value = value;
}
}
// 查找函数
int get(const char* key) {
int index = hash(key);
int originalIndex = index;
while (table[index].isOccupied != 0) {
if (table[index].isOccupied == 1 && strcmp(table[index].key, key) == 0) {
return table[index].value;
}
index = (index + 1) % TABLE_SIZE;
if (index == originalIndex) {
break;
}
}
return -1;
}
// 删除函数
void delete(const char* key) {
int index = hash(key);
int originalIndex = index;
while (table[index].isOccupied != 0) {
if (table[index].isOccupied == 1 && strcmp(table[index].key, key) == 0) {
free(table[index].key);
table[index].key = NULL;
table[index].isOccupied = -1;
printf("已删除 '%s'\n", key);
return;
}
index = (index + 1) % TABLE_SIZE;
if (index == originalIndex) {
break;
}
}
printf("未找到键 '%s'。\n", key);
}
int main() {
init_table();
// 插入测试数据
insert("apple", 10);
insert("banana", 20);
insert("orange", 30);
insert("grape", 40);
printf("apple: %d\n", get("apple"));
printf("banana: %d\n", get("banana"));
// 删除测试
delete("banana");
printf("删除后 banana: %d\n", get("banana"));
// 重新插入
insert("banana", 50);
printf("重新插入后 banana: %d\n", get("banana"));
return 0;
}

运行结果

apple: 10
banana: 20
已删除 'banana'
删除后 banana: -1
重新插入后 banana: 50

性能分析

时间复杂度

平均情况: O(1) - 插入、查找、删除

最坏情况: O(n) - 当哈希表接近满时

最佳情况: O(1) - 无冲突时

空间复杂度

固定大小: O(1) - 预分配TABLE_SIZE个槽位

动态大小: O(n) - 根据实际数据量调整

优化建议

1. 动态扩容

// 动态扩容实现思路
void resize_table() {
// 1. 保存旧表数据
// 2. 创建更大的新表
// 3. 重新哈希所有数据
// 4. 释放旧表内存
}

2. 更好的哈希函数

// 改进的哈希函数
unsigned int improved_hash(const char* key) {
unsigned int hash = 5381;
int c;
while ((c = *key++)) {
hash = ((hash << 5) + hash) + c; // hash * 33 + c
}
return hash % TABLE_SIZE;
}

3. 双重哈希

// 双重哈希函数
unsigned int hash1(const char* key) {
// 主哈希函数
}
unsigned int hash2(const char* key) {
// 辅助哈希函数
}
// 双重哈希探测
int index = hash1(key);
int step = hash2(key);
while (冲突) {
index = (index + step) % TABLE_SIZE;
}

实际应用场景

1. 缓存系统

// 简单的LRU缓存
typedef struct {
char* key;
void* data;
time_t access_time;
int isOccupied;
} CacheItem;

2. 符号表

// 编译器符号表
typedef struct {
char* symbol_name;
int symbol_type;
int scope_level;
int isOccupied;
} SymbolTableItem;

3. 配置管理

// 配置项存储
typedef struct {
char* config_key;
char* config_value;
int isOccupied;
} ConfigItem;

常见问题解决

1. 内存泄漏

// 清理哈希表
void cleanup_table() {
for (int i = 0; i < TABLE_SIZE; i++) {
if (table[i].isOccupied == 1) {
free(table[i].key);
table[i].key = NULL;
}
}
}

2. 哈希冲突过多

// 监控冲突率
int collision_count(const char* key) {
int index = hash(key);
int originalIndex = index;
int collisions = 0;
while (table[index].isOccupied == 1 && strcmp(table[index].key, key) != 0) {
index = (index + 1) % TABLE_SIZE;
collisions++;
if (index == originalIndex) break;
}
return collisions;
}

今日总结

我们实现了一个简单但完整的C语言哈希表，使用线性探测法解决冲突：

核心要点

数据结构设计: 使用结构体存储键值对和状态信息

哈希函数: 简单有效的字符串哈希算法

冲突解决: 线性探测法处理哈希冲突

内存管理: 正确分配和释放动态内存

墓碑标记: 删除操作的特殊处理

关键特性

快速操作: 平均O(1)时间复杂度的查找、插入、删除

内存效率: 固定大小的数组存储

冲突处理: 线性探测确保数据完整性

易于理解: 清晰的代码结构和注释

扩展方向

动态扩容: 实现自动调整表大小

多种探测: 双重哈希、二次探测

泛型支持: 支持任意数据类型

性能优化: 负载因子监控和自动调整

练习建议

基础练习: 实现不同的哈希函数并比较性能

进阶练习: 添加动态扩容功能

实战练习: 实现LRU缓存或符号表

优化练习: 添加性能监控和统计功能

扩展阅读

掌握哈希表的实现原理，是理解高效数据结构的重要基础！

探客时代

C语言哈希表实现：线性探测法深度解析