置顶
Hermes Agent "从安装到优化"
在这篇文章中,我分享了对Hermes Agent的初步探索,聚焦其“越用越懂你”的学习闭环理念。我从个人学习路径出发,介绍了它的三层认知持久化模型——记忆、技能与会话检索,并与OpenClaw做了对比。文章强调干中学,不追求标准答案,重在动手实践中的理解。
Kafka 故障排查周期长?试试 Kdoctor
Kdoctor,一个用于快速排查Kafka问题的单二进制工具。它源于实际排障经验不足的痛点,旨在通过串联网络、控制面、客户端链路及容器环境检查,帮助一线人员快速定位问题根源。工具设计克制,无需复杂配置,仅凭一个地址即可运行,输入越完整则诊断越精准。
Supervisor进程管理工具守护服务高可用与稳定运行
本文介绍了Supervisor这一用Python开发的Linux进程管理工具。它通过supervisord服务端管理子进程,提供进程监控、异常自动重启、日志捕获等功能,解决了传统后台进程管理繁琐、无保活等痛点。
服务器裸奔公网?手把手教你用nftables打造自己的铜墙铁壁
最近入手了一台小厂轻量服务器,发现其网络架构竟是“裸奔”公网——没有安全组、内网IP或防火墙,公网流量直抵网卡。为避免服务器成为“宴请八方”的靶子,我决定配置防火墙。经过对比,选择了系统原生支持、性能更优且语法简洁的nftables,并介绍了其核心架构、工作流程及与iptables的差异。
网络监控-黑盒测试
黑盒监控是业务可用性的守门员,我们无需关心服务内部如何实现,只需像真实用户一样验证其关键功能是否正常。这通常体现为使用自动化工具定期探测核心服务的端口状态、HTTP接口的返回状态码、响应时间以及SSL证书有效性等。
Redis 哨兵模式:从集群部署到微服务调用的高可用落地指南
Redis哨兵模式介绍 在Redis实战部署中,高可用是绕不开的核心需求,一旦Redis主节点故障,业务缓存中断、会话数据丢失等问题会直接冲击系统稳定性。
AIOps:OpenCode+Skills+Nightingale MCP实现高效监控分析
一套能跑起来的 AI 运维交互环境 一套可控、低 token 的 Skills 编排方法 一套夜莺 MCP 接入与排障经验。
EFK日志管理系统实践
本文介绍了EFK日志管理系统的实施方案与实操指南。EFK(Elasticsearch+Fluent Bit+Kibana)是一套经典的日志管理方案,能够将分散杂乱的文本日志转换为结构化数据,实现统一检索和分析。







